CNR Institutional Research Information System

Viene descritta la prima versione ufficiale del sistema di segmentazione semiautomatica del segnale vocale denominato SLAM (dall'acronimo inglese Segmentation and Labelling Automatic Module), sviluppato in ambiente Windows per Personal Computer presso il CSRF. SLAM fornisce in modo automatico alcune ipotesi di segmentazione allo scopo di rendere più veloce il compito di esperti fonetisti nell'analizzare grossi corpora di segnale verbale. Sulla base della conoscenza ortografica del testo pronunciato gli esperti devono scegliere l'allineamento più opportuno fra quelli proposti automaticamente. Il sistema riceve in ingresso i parametri forniti da un modello del sistema uditivo periferico dimostratosi molto efficace nel codificare le informazioni contenute nel segnale vocale e si basa sulla teoria della segmentazione multi-livello per la costruzione delle ipotesi di segmentazione. Oltre alla segmentazione del parlato, il sistema fornisce all'utente numerose possibilità di visualizzazione di vari parametri di analisi, tra cui vari tipi di 'spettrogramma', l'andamento della frequenza fondamentale, dell'energia e dello 'zero-crossing' ed altri ancora. All'utente sono inoltre consentite alcune elementari operazioni di editing del segnale quali 'taglia' e 'incolla' 'cancella' e molte altre. Il sistema è stato sviluppato in linguaggio di programmazione Microsoft C++© per il sistema operativo Microsoft Windows 3.1© ma è supportato anche in ambiente Windows 95© e WindowsNT 4.0© ed in particolari architetture Macintosh©. SLAM è disponibile a chi ne facesse esplicita richiesta ed è distribuito in rete dal CSRF.

SLAM v1.0 per Windows

Cosi P

1998

Abstract

Viene descritta la prima versione ufficiale del sistema di segmentazione semiautomatica del segnale vocale denominato SLAM (dall'acronimo inglese Segmentation and Labelling Automatic Module), sviluppato in ambiente Windows per Personal Computer presso il CSRF. SLAM fornisce in modo automatico alcune ipotesi di segmentazione allo scopo di rendere più veloce il compito di esperti fonetisti nell'analizzare grossi corpora di segnale verbale. Sulla base della conoscenza ortografica del testo pronunciato gli esperti devono scegliere l'allineamento più opportuno fra quelli proposti automaticamente. Il sistema riceve in ingresso i parametri forniti da un modello del sistema uditivo periferico dimostratosi molto efficace nel codificare le informazioni contenute nel segnale vocale e si basa sulla teoria della segmentazione multi-livello per la costruzione delle ipotesi di segmentazione. Oltre alla segmentazione del parlato, il sistema fornisce all'utente numerose possibilità di visualizzazione di vari parametri di analisi, tra cui vari tipi di 'spettrogramma', l'andamento della frequenza fondamentale, dell'energia e dello 'zero-crossing' ed altri ancora. All'utente sono inoltre consentite alcune elementari operazioni di editing del segnale quali 'taglia' e 'incolla' 'cancella' e molte altre. Il sistema è stato sviluppato in linguaggio di programmazione Microsoft C++© per il sistema operativo Microsoft Windows 3.1© ma è supportato anche in ambiente Windows 95© e WindowsNT 4.0© ed in particolari architetture Macintosh©. SLAM è disponibile a chi ne facesse esplicita richiesta ed è distribuito in rete dal CSRF.

Scheda breve

Scheda completa

Scheda completa (DC)

	Anno
	
				1998
			
	Strutture organizzative
	
				Istituto di Scienze e Tecnologie della Cognizione - ISTC
Istituto di Scienze e Tecnologie della Cognizione - ISTC
			
	Parole chiave
	
				Slam
Windows
Segmentazione
			
	Appare nelle tipologie:
	
				04.01 Contributo in Atti di convegno

File in questo prodotto:

Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/15853

Citazioni

ND

ND

ND

social impact