Viene descritta una applicazione per la sintesi vocale dell'italiano. È progettata per implementare la parte di elaborazione del segnale di un sistema TTS, ovvero quella che si occupa di creare un file audio (.wav) a partire da un file fonetico (.pho) relativo alla frase da pronunciare. A tale scopo viene utilizzato un database di difoni pre-registrati, dalla cui concatenazione si ottiene l'output audio. Le operazioni sui difoni vengono effettuate secondo tecniche sinusoidali (più precisamente tecniche SMS, Spectral Modeling Synthesis). Il database di difoni è quello usato da MBROLA, applicazione di sintesi vocale nel dominio temporale. Tale programma è stato usato in alcuni test di confronto. È stato utilizzato lo Spectral Modeling Synthesis (SMS) come modello spettrale per l'elaborazioni del segnale, ed in particolare il framework CLAM per l'implementazione software.

Sintesi Vocale Concatenativa per l italiano Tramite Modello Sinusoidale

Giacomo Sommavilla;Piero Cosi
2006

Abstract

Viene descritta una applicazione per la sintesi vocale dell'italiano. È progettata per implementare la parte di elaborazione del segnale di un sistema TTS, ovvero quella che si occupa di creare un file audio (.wav) a partire da un file fonetico (.pho) relativo alla frase da pronunciare. A tale scopo viene utilizzato un database di difoni pre-registrati, dalla cui concatenazione si ottiene l'output audio. Le operazioni sui difoni vengono effettuate secondo tecniche sinusoidali (più precisamente tecniche SMS, Spectral Modeling Synthesis). Il database di difoni è quello usato da MBROLA, applicazione di sintesi vocale nel dominio temporale. Tale programma è stato usato in alcuni test di confronto. È stato utilizzato lo Spectral Modeling Synthesis (SMS) come modello spettrale per l'elaborazioni del segnale, ed in particolare il framework CLAM per l'implementazione software.
2006
Istituto di Scienze e Tecnologie della Cognizione - ISTC
Istituto di Scienze e Tecnologie della Cognizione - ISTC
Italiano
Inglese
Savy R., Crocco C.
AISV 2005 - Atti 2° Convegno Nazionale AISV - "Analisi prosodica" - Teorie, modelli e sistemi di annotazione
AISV 2005 - 2° Convegno Nazionale AISV - "Analisi prosodica - teorie, modelli e sistemi di annotazione"
113 (CD Rom 761)
113 (CD Rom 772)
113
88-95112-21-0
http://www.aisv.it/AISV2005/default.htm
EDK Editore
Torriana
ITALIA
Sì, ma tipo non specificato
Novembre 30 - December 2, 2005
Fisciano, Salerno, Italy
Sintesi Vocale
Modello Sinusoidale
Sintesi Concatenativa
Sommavilla G., Drioli C., Cosi P. "Sintesi Vocale Concatenativa per l'italiano Tramite Modello Sinusoidale" in Savy R., Crocco C. (editors) Abstract Book & CD-Rom Proceedings of AISV 2005, 2nd Conference of Associazione Italiana di Scienze della Voce "Analisi Prosodica" - Teorie, modelli e sistemi di annotazione Salerno, Italy Novembre 30 - December 2, 2005 EDK Editore s.r.l. Padova, 2006 pp. 761-772 (113).
2
none
Giacomo Sommavilla; Carlo Drioli; Piero Cosi
273
info:eu-repo/semantics/conferenceObject
04 Contributo in convegno::04.01 Contributo in Atti di convegno
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/140138
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact