The environmental time series always show the presence ofgaps, but to deal with data it needs to fi ll in the gaps estimating the lack values . At present, a lot of statis tical techniques are available to carry out that fi lling in, they goes fro m the simplest, e.g. the use of the sample mean, to the most sophisticated ones, e.g. the multiple imputation. The present paper proposes a brand new methodology fo r the lack data estima tion, that methodology tries to merge the obvio us advantages of the simplest techniques (e.g. their vocation to be easily implemented) with one of the strenght point of the newest techniques, namely the uncertainty assessment associated to the estimated value. The proposed method has been applied to the daily rainfall data coming f rom the Candelaro river basin (Puglia) and is composed by two stages; the fi rst one looks fo r the sites more similar to that whose time series presents a gap; the second stage carries out the actual estimation of the gap using a regressive non parametrical method.

Quando si lavora con i dati ambientali, spesso, una delle prime operazioni cui bisogna sottopo rre i dati consiste nel riempi re i "gaps" presenti nella matrice, stimando i valori mancanti . Attualmente, numerose tecniche statistiche sono disponi bili per eseguire tale ope razione, da quelle estremamente semplici come la sos tituzione con la media campio naria a quelle phi sofisticate, come l 'imputatione multipla. II presente lavoro propone una Iluova metodolog ia per la stima dei dati mancanti, che cerca di coniugare alcuni vantaggi offerti dalle tecniche piu semplici (cioe il fatto di essere speditive e facilmente automatirzabili) con uno dei maggiori pun ti di fo rza delle tecniche p hi sofis ticate, cioe quello di forn ire anche una stima dell' incertezza associata al dato imputato. II metodo proposto estato applicato ai dati pluviometrici giorna lieri del bacino del Candelaro (Puglia) e si articola ill 2 fasi; la prima consiste nell' individuazione dei siti piu "simili" a quello in cui epresente il valore manca nte; la seconda consiste nell'effettuare la stima vera e propria del dato utilizzando un metodo regressivo non para metrico.

METODO SPEDITIVO PER LA STIMA DEI DATI MANCANTI E SUA APPLICAZIONE AI DATI PLUVIOMETRICI GIORNALIERI DEL BACINO DEL CANDELARO (PUGLIA)

BARCA E;PASSARELLA G
2006

Abstract

The environmental time series always show the presence ofgaps, but to deal with data it needs to fi ll in the gaps estimating the lack values . At present, a lot of statis tical techniques are available to carry out that fi lling in, they goes fro m the simplest, e.g. the use of the sample mean, to the most sophisticated ones, e.g. the multiple imputation. The present paper proposes a brand new methodology fo r the lack data estima tion, that methodology tries to merge the obvio us advantages of the simplest techniques (e.g. their vocation to be easily implemented) with one of the strenght point of the newest techniques, namely the uncertainty assessment associated to the estimated value. The proposed method has been applied to the daily rainfall data coming f rom the Candelaro river basin (Puglia) and is composed by two stages; the fi rst one looks fo r the sites more similar to that whose time series presents a gap; the second stage carries out the actual estimation of the gap using a regressive non parametrical method.
2006
Istituto di Ricerca Sulle Acque - IRSA
Quando si lavora con i dati ambientali, spesso, una delle prime operazioni cui bisogna sottopo rre i dati consiste nel riempi re i "gaps" presenti nella matrice, stimando i valori mancanti . Attualmente, numerose tecniche statistiche sono disponi bili per eseguire tale ope razione, da quelle estremamente semplici come la sos tituzione con la media campio naria a quelle phi sofisticate, come l 'imputatione multipla. II presente lavoro propone una Iluova metodolog ia per la stima dei dati mancanti, che cerca di coniugare alcuni vantaggi offerti dalle tecniche piu semplici (cioe il fatto di essere speditive e facilmente automatirzabili) con uno dei maggiori pun ti di fo rza delle tecniche p hi sofis ticate, cioe quello di forn ire anche una stima dell' incertezza associata al dato imputato. II metodo proposto estato applicato ai dati pluviometrici giorna lieri del bacino del Candelaro (Puglia) e si articola ill 2 fasi; la prima consiste nell' individuazione dei siti piu "simili" a quello in cui epresente il valore manca nte; la seconda consiste nell'effettuare la stima vera e propria del dato utilizzando un metodo regressivo non para metrico.
Gaps
Non Parametrical Regression
Uncertainty
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/62213
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact