Viene descritta la prima versione ufficiale del sistema di segmentazione semiautomatica del segnale vocale denominato SLAM (dall'acronimo inglese Segmentation and Labelling Automatic Module), sviluppato in ambiente Windows per Personal Computer presso il CSRF. SLAM fornisce in modo automatico alcune ipotesi di segmentazione allo scopo di rendere più veloce il compito di esperti fonetisti nell'analizzare grossi corpora di segnale verbale. Sulla base della conoscenza ortografica del testo pronunciato gli esperti devono scegliere l'allineamento più opportuno fra quelli proposti automaticamente. Il sistema riceve in ingresso i parametri forniti da un modello del sistema uditivo periferico dimostratosi molto efficace nel codificare le informazioni contenute nel segnale vocale e si basa sulla teoria della segmentazione multi-livello per la costruzione delle ipotesi di segmentazione. Oltre alla segmentazione del parlato, il sistema fornisce all'utente numerose possibilità di visualizzazione di vari parametri di analisi, tra cui vari tipi di 'spettrogramma', l'andamento della frequenza fondamentale, dell'energia e dello 'zero-crossing' ed altri ancora. All'utente sono inoltre consentite alcune elementari operazioni di editing del segnale quali 'taglia' e 'incolla' 'cancella' e molte altre. Il sistema è stato sviluppato in linguaggio di programmazione Microsoft C++© per il sistema operativo Microsoft Windows 3.1© ma è supportato anche in ambiente Windows 95© e WindowsNT 4.0© ed in particolari architetture Macintosh©. SLAM è disponibile a chi ne facesse esplicita richiesta ed è distribuito in rete dal CSRF.
SLAM v1.0 per Windows
Cosi P
1998
Abstract
Viene descritta la prima versione ufficiale del sistema di segmentazione semiautomatica del segnale vocale denominato SLAM (dall'acronimo inglese Segmentation and Labelling Automatic Module), sviluppato in ambiente Windows per Personal Computer presso il CSRF. SLAM fornisce in modo automatico alcune ipotesi di segmentazione allo scopo di rendere più veloce il compito di esperti fonetisti nell'analizzare grossi corpora di segnale verbale. Sulla base della conoscenza ortografica del testo pronunciato gli esperti devono scegliere l'allineamento più opportuno fra quelli proposti automaticamente. Il sistema riceve in ingresso i parametri forniti da un modello del sistema uditivo periferico dimostratosi molto efficace nel codificare le informazioni contenute nel segnale vocale e si basa sulla teoria della segmentazione multi-livello per la costruzione delle ipotesi di segmentazione. Oltre alla segmentazione del parlato, il sistema fornisce all'utente numerose possibilità di visualizzazione di vari parametri di analisi, tra cui vari tipi di 'spettrogramma', l'andamento della frequenza fondamentale, dell'energia e dello 'zero-crossing' ed altri ancora. All'utente sono inoltre consentite alcune elementari operazioni di editing del segnale quali 'taglia' e 'incolla' 'cancella' e molte altre. Il sistema è stato sviluppato in linguaggio di programmazione Microsoft C++© per il sistema operativo Microsoft Windows 3.1© ma è supportato anche in ambiente Windows 95© e WindowsNT 4.0© ed in particolari architetture Macintosh©. SLAM è disponibile a chi ne facesse esplicita richiesta ed è distribuito in rete dal CSRF.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.