Viene descritta una applicazione per la sintesi vocale dell'italiano. È progettata per implementare la parte di elaborazione del segnale di un sistema TTS, ovvero quella che si occupa di creare un file audio (.wav) a partire da un file fonetico (.pho) relativo alla frase da pronunciare. A tale scopo viene utilizzato un database di difoni pre-registrati, dalla cui concatenazione si ottiene l'output audio. Le operazioni sui difoni vengono effettuate secondo tecniche sinusoidali (più precisamente tecniche SMS, Spectral Modeling Synthesis). Il database di difoni è quello usato da MBROLA, applicazione di sintesi vocale nel dominio temporale. Tale programma è stato usato in alcuni test di confronto. È stato utilizzato lo Spectral Modeling Synthesis (SMS) come modello spettrale per l'elaborazioni del segnale, ed in particolare il framework CLAM per l'implementazione software.

Sintesi Vocale Concatenativa per l italiano Tramite Modello Sinusoidale

Giacomo Sommavilla;Piero Cosi
2006

Abstract

Viene descritta una applicazione per la sintesi vocale dell'italiano. È progettata per implementare la parte di elaborazione del segnale di un sistema TTS, ovvero quella che si occupa di creare un file audio (.wav) a partire da un file fonetico (.pho) relativo alla frase da pronunciare. A tale scopo viene utilizzato un database di difoni pre-registrati, dalla cui concatenazione si ottiene l'output audio. Le operazioni sui difoni vengono effettuate secondo tecniche sinusoidali (più precisamente tecniche SMS, Spectral Modeling Synthesis). Il database di difoni è quello usato da MBROLA, applicazione di sintesi vocale nel dominio temporale. Tale programma è stato usato in alcuni test di confronto. È stato utilizzato lo Spectral Modeling Synthesis (SMS) come modello spettrale per l'elaborazioni del segnale, ed in particolare il framework CLAM per l'implementazione software.
2006
Istituto di Scienze e Tecnologie della Cognizione - ISTC
Istituto di Scienze e Tecnologie della Cognizione - ISTC
88-95112-21-0
Sintesi Vocale
Modello Sinusoidale
Sintesi Concatenativa
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/140138
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact