La segmentazione e l'etichettatura del segnale vocale, sono considerate come le procedure con cui particolari etichette di qualsivoiglia livello, fonemico, fonetico o acustico vengono attribuite alla forma d'onda. L'allineamento temporale di una trascrizione con la corrispondente forma d'onda tende ovviamente a stabilire una corrispondenza diretta fra la trascrizione stessa e importanti variazioni acustiche del segnale. Tradizionalmente queste operazioni vengono eseguite "manualrnente" da esperti fonetisti. Nonostante la sempre maggiore affidabilità dei sistemi di visualizzazione della forma d'onda, dell'energia, della curva della frequenza fondamentale e dello spettrogramma del segnale vocale, ormai perfezionatissirni e quasi sempre associati a precisi e complessi sistemi d'ascolto, nell'operato degli esperti the operano la segmentazione sono sempre riscontrabili delle divergenze pin o mono significative. L'insierne delle etichette da utilizzare a la strategia di segmentazione sono due "variabili" estrernamente discusse e sulle quail non si registra un accordo assoluto. Con il presente lavoro si a cercato di uniformare la strategia di segmentazione e si sono verificati statisticamente i risultati della segmentazione dello stesso materiale vocale di riferimento da parte di più esperti. La determinazione statistica del livello di deviazione delle decisioni umane nel processo di segmentazione servirà come unità di paragone nell'esaminare successivamente gli errori compiuti sullo stesso materiale vocale da parte di diversi algoritmi automatici di segmentazione, al fine di valutarne it rispettivo grado di affidabilità.

Caratterizzazione Statistica della Segmentazione Manuale del Segnale Vocale

Cosi P;
1991

Abstract

La segmentazione e l'etichettatura del segnale vocale, sono considerate come le procedure con cui particolari etichette di qualsivoiglia livello, fonemico, fonetico o acustico vengono attribuite alla forma d'onda. L'allineamento temporale di una trascrizione con la corrispondente forma d'onda tende ovviamente a stabilire una corrispondenza diretta fra la trascrizione stessa e importanti variazioni acustiche del segnale. Tradizionalmente queste operazioni vengono eseguite "manualrnente" da esperti fonetisti. Nonostante la sempre maggiore affidabilità dei sistemi di visualizzazione della forma d'onda, dell'energia, della curva della frequenza fondamentale e dello spettrogramma del segnale vocale, ormai perfezionatissirni e quasi sempre associati a precisi e complessi sistemi d'ascolto, nell'operato degli esperti the operano la segmentazione sono sempre riscontrabili delle divergenze pin o mono significative. L'insierne delle etichette da utilizzare a la strategia di segmentazione sono due "variabili" estrernamente discusse e sulle quail non si registra un accordo assoluto. Con il presente lavoro si a cercato di uniformare la strategia di segmentazione e si sono verificati statisticamente i risultati della segmentazione dello stesso materiale vocale di riferimento da parte di più esperti. La determinazione statistica del livello di deviazione delle decisioni umane nel processo di segmentazione servirà come unità di paragone nell'esaminare successivamente gli errori compiuti sullo stesso materiale vocale da parte di diversi algoritmi automatici di segmentazione, al fine di valutarne it rispettivo grado di affidabilità.
1991
Istituto di Scienze e Tecnologie della Cognizione - ISTC
Istituto di Scienze e Tecnologie della Cognizione - ISTC
Statistica
Segmentazione Manuale
Segnale Vocale
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/16697
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact