Viene descritta una procedura per la creazione di una funzione di trasformazione di un segnale vocale neutro in uno caratterizzato emotivamente. Questa funzione è stata sviluppata sulla base di un modello statistico, a mistura di funzioni gaussiane, dello spettro del segnale vocale. Sono utilizzati, come segnali di riferimento per l'allenamento del modello, due database di segnali vocali creati ad hoc: uno registrato da un parlatore, simulando l'emozione della collera, e uno neutro, con la stessa intonazione e durata dei fonemi, ottenuto con un sintetizzatore vocale per concatenazione di difoni, che utilizza la "voce" dello stesso parlatore. Il modello a mistura di gaussiane, addestrato sui coefficienti mel-cepstrali estratti dal segnale neutro, è utilizzato per dividere questo spazio acustico in classi fonetiche equivalenti e per calcolare, per ogni classe identificata, i parametri delle funzioni di conversione. Il metodo di trasformazione del segnale nel dominio delle frequenze ha fornito delle ottime prestazioni, come è stato dimostrato da un test percettivo in cui un segnale neutro convertito è stato riconosciuto come "arrabbiato".

Modellizzazione della Prosodia e del Timbro per la Sintesi del Parlato Emotivo

Piero Cosi
2006

Abstract

Viene descritta una procedura per la creazione di una funzione di trasformazione di un segnale vocale neutro in uno caratterizzato emotivamente. Questa funzione è stata sviluppata sulla base di un modello statistico, a mistura di funzioni gaussiane, dello spettro del segnale vocale. Sono utilizzati, come segnali di riferimento per l'allenamento del modello, due database di segnali vocali creati ad hoc: uno registrato da un parlatore, simulando l'emozione della collera, e uno neutro, con la stessa intonazione e durata dei fonemi, ottenuto con un sintetizzatore vocale per concatenazione di difoni, che utilizza la "voce" dello stesso parlatore. Il modello a mistura di gaussiane, addestrato sui coefficienti mel-cepstrali estratti dal segnale neutro, è utilizzato per dividere questo spazio acustico in classi fonetiche equivalenti e per calcolare, per ogni classe identificata, i parametri delle funzioni di conversione. Il metodo di trasformazione del segnale nel dominio delle frequenze ha fornito delle ottime prestazioni, come è stato dimostrato da un test percettivo in cui un segnale neutro convertito è stato riconosciuto come "arrabbiato".
2006
Istituto di Scienze e Tecnologie della Cognizione - ISTC
Istituto di Scienze e Tecnologie della Cognizione - ISTC
Italiano
Renata Savy, Claudia Crocco
AISV 2005, 2nd Conveno Nazionale Associazione Italiana di Scienze della Voce - "Analisi prosodica - teorie, modelli e sistemi di annotazione"
AISV 2005, 2° Conveno Nazionale Associazione Italiana di Scienze della Voce - "Analisi prosodica - teorie, modelli e sistemi di annotazione"
87 (CD Rom 285)
87 (CD Rom 313)
113
88-95112-21-0
http://www.aisv.it/AISV2005/default.htm
EDK Editore
Torriana
ITALIA
Sì, ma tipo non specificato
Novembre 30 - December 2, 2005
Fisciano, Salerno, Italy
Prosodia
Timbro
Sintesi
Parlato
Emotivo
Nicolao M., Drioli C., Cosi P. "Modellizzazione della Prosodia e del Timbro per la Sintesi del Parlato Emotivo" in Savy R., Crocco C. (editors) Abstract Book & CD-Rom Proceedings of AISV 2005, 2nd Conference of Associazione Italiana di Scienze della Voce "Analisi Prosodica" - Teorie, modelli e sistemi di annotazione Salerno, Italy Novembre 30 - December 2, 2005 EDK Editore s.r.l. Padova, 2006 pp. 285-313 (87). AISV 2005, 2nd Conveno Nazionale Associazione Italiana di Scienze della Voce - "Analisi prosodica - teorie, modelli e sistemi di annotazione" http://www.aisv.it/it/convegni-aisv?start=7
3
none
Nicolao, Mauro; Drioli, Carlo; Cosi, Piero
273
info:eu-repo/semantics/conferenceObject
04 Contributo in convegno::04.01 Contributo in Atti di convegno
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/140139
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact