L'objet de cet article est d'examiner la méthode classique d'extraction de la fondamentale basée sur l'analyse par autocorrélation à court terme du signal de parole. Il est tenu compte de deux estimateurs communément utilisés et de l'effet de la fenêtre de prélèvement du signal. Il est montré qu'une décomposition similaire de l'autocorrélation estimée vaut pour le cas d'un signal périodique comme pour le cas d'un signal aléatoire. Une telle décomposition permet de prédire les mérites relatifs des estimateurs considérés pour autant qu'il soit question des erreurs grossières et des erreurs de voisement. Le comportement prédit s'avère être en bon accord avec les résultats obtenus en appliquant l'algorithme SIFT à la parole naturelle.

The aim of this paper is to consider the classical pitch determination method based on the short-time autorcorrelation analysis of the speech signal. Two commonly used estimators and the effect of signal windowing are taken into account. It is shown that in both periodic and purely random cases a similar decomposition holds for the estimated autocorrelation. Such a decomposition makes it possible to foresee the relative merits of the estimators considered, at least as far as gross pitch determination errors and voicing-errors are concerned. The expected behaviour is found to be in good agreement with results obtained through applying the SIFT algorithm to real speech.

On the use of autocorrelation for pitch extraction: some statistical considerations and their application to the SIFT algorithm

Cosi P;
1984

Abstract

The aim of this paper is to consider the classical pitch determination method based on the short-time autorcorrelation analysis of the speech signal. Two commonly used estimators and the effect of signal windowing are taken into account. It is shown that in both periodic and purely random cases a similar decomposition holds for the estimated autocorrelation. Such a decomposition makes it possible to foresee the relative merits of the estimators considered, at least as far as gross pitch determination errors and voicing-errors are concerned. The expected behaviour is found to be in good agreement with results obtained through applying the SIFT algorithm to real speech.
1984
Istituto di Scienze e Tecnologie della Cognizione - ISTC
L'objet de cet article est d'examiner la méthode classique d'extraction de la fondamentale basée sur l'analyse par autocorrélation à court terme du signal de parole. Il est tenu compte de deux estimateurs communément utilisés et de l'effet de la fenêtre de prélèvement du signal. Il est montré qu'une décomposition similaire de l'autocorrélation estimée vaut pour le cas d'un signal périodique comme pour le cas d'un signal aléatoire. Une telle décomposition permet de prédire les mérites relatifs des estimateurs considérés pour autant qu'il soit question des erreurs grossières et des erreurs de voisement. Le comportement prédit s'avère être en bon accord avec les résultats obtenus en appliquant l'algorithme SIFT à la parole naturelle.
Speech
Pitch Detection
Linear Prediction
Autocorrelation
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/175498
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact