Si presenta un nuovo motore di sintesi audio che si occupa di eseguire le operazioni di Digital Signal Processing (DSP) di un sistema di Text-To-Speech basato su concatenazione di difoni. L'input fone tico (una sequenza di fonemi con lunghezze e valori di intonazione prodotta da FESTIVAL a partire da testo sc ritto) viene convertito nel segnale audio. Il lavoro descritto vuole essere un'alternativa a MBROLA e fa uso della rappresentazione SMS ("Spectral Modeling Synthesis"), implementata dal framework CLAM (C++ Library for Audio and Music). Il programma verrà pubblicato con licenza open source (GPL), e funzionerà su qualsiasi piattaforma che disponga di gcc e CLAM (per esempio i sistemi Windows, Linux e Mac OS X).
SMS-FESTIVAL: un nuovo ambiente di lavoro per la sintesi vocale da testo scritto
Sommavilla G;Cosi P;Paci G
2006
Abstract
Si presenta un nuovo motore di sintesi audio che si occupa di eseguire le operazioni di Digital Signal Processing (DSP) di un sistema di Text-To-Speech basato su concatenazione di difoni. L'input fone tico (una sequenza di fonemi con lunghezze e valori di intonazione prodotta da FESTIVAL a partire da testo sc ritto) viene convertito nel segnale audio. Il lavoro descritto vuole essere un'alternativa a MBROLA e fa uso della rappresentazione SMS ("Spectral Modeling Synthesis"), implementata dal framework CLAM (C++ Library for Audio and Music). Il programma verrà pubblicato con licenza open source (GPL), e funzionerà su qualsiasi piattaforma che disponga di gcc e CLAM (per esempio i sistemi Windows, Linux e Mac OS X).I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.