La salvaguardia della vita umana rappresenta una priorità in caso di disastri di origine naturale. La disponibilità di strumenti che permettano di valutare le condizioni di pericolosità, esposizione e vulnerabilità predisponenti il verificarsi di condizioni di insicurezza, e quindi la morte del singolo individuo, è quindi fondamentale per un'efficace gestione del rischio alluvionale, sia in condizioni di emergenza che in tempo di pace. Le attuali capacità di modellazione in questo ambito risultano tuttavia limitate. Questo contributo presenta un primo modello della mortalità legata a fenomeni alluvionali, per il contesto italiano, sviluppato utilizzando strumenti di machine learning. I dati alla base del modello derivano dal database POLARIS, sviluppato e gestito dal CNR-Irpi di Perugia, e relativi ai decessi occorsi a causa di fenomeni di natura alluvionale, nel bacino del Po, nel periodo 1965-2019. A partire dalle evidenze disponibili in letteratura sono state identificate le principali variabili di pericolosità, esposizione, e vulnerabilità correlate al verificarsi di casi di morte dovuti a fenomeni di origine alluvionale. Il valore di queste variabili è stato quindi valutato per ogni decesso nel database, a partire dalle informazioni contenute nello stesso database, da un'analisi dei dati idrologici e idraulici relativi agli eventi alluvionali corrispondenti, nonché dall'analisi dei dati territoriali relativi alle aree in cui si sono verificati i decessi. L'operazione ha portato alla definizione di un database di 127 record di mortalità ognuno corredato dal valore di 11 variabili esplicative. Al fine di permettere all'algoritmo Random Forest di valutare l'importanza di ogni variabile nel descrivere gli eventi di mortalità, è stato quindi creato un database sintetico di non-decessi, a partire dalla distribuzione in frequenza delle variabili esplicative nelle aree colpite dagli eventi alluvionali inclusi nel database di partenza. Quest'ultimo è stato quindi completato con 1270 record di non-decessi per ognuno dei quali è stato valutato il valore delle 11 variabili esplicative. La calibrazione e successiva validazione dell'algoritmo Randon Forest su due set di dati differenti ha portato alla scelta del modello finale caratterizzato da un'accuratezza del 68%. Nondimeno, l'analisi ha permesso di identificare l'importanza delle diverse variabili esplicative per il determinarsi di condizioni di insicurezza, fornendo utili indicazioni per la riduzione e gestione del rischio di morte in caso di alluvione.

L'uso dei metodi Random Forest per la modellazione della mortalità legata a fenomeni alluvionali

Marco Zazzeri;Mohammed Hammouti;Paola Salvati;Simone Sterlacchini
2021

Abstract

La salvaguardia della vita umana rappresenta una priorità in caso di disastri di origine naturale. La disponibilità di strumenti che permettano di valutare le condizioni di pericolosità, esposizione e vulnerabilità predisponenti il verificarsi di condizioni di insicurezza, e quindi la morte del singolo individuo, è quindi fondamentale per un'efficace gestione del rischio alluvionale, sia in condizioni di emergenza che in tempo di pace. Le attuali capacità di modellazione in questo ambito risultano tuttavia limitate. Questo contributo presenta un primo modello della mortalità legata a fenomeni alluvionali, per il contesto italiano, sviluppato utilizzando strumenti di machine learning. I dati alla base del modello derivano dal database POLARIS, sviluppato e gestito dal CNR-Irpi di Perugia, e relativi ai decessi occorsi a causa di fenomeni di natura alluvionale, nel bacino del Po, nel periodo 1965-2019. A partire dalle evidenze disponibili in letteratura sono state identificate le principali variabili di pericolosità, esposizione, e vulnerabilità correlate al verificarsi di casi di morte dovuti a fenomeni di origine alluvionale. Il valore di queste variabili è stato quindi valutato per ogni decesso nel database, a partire dalle informazioni contenute nello stesso database, da un'analisi dei dati idrologici e idraulici relativi agli eventi alluvionali corrispondenti, nonché dall'analisi dei dati territoriali relativi alle aree in cui si sono verificati i decessi. L'operazione ha portato alla definizione di un database di 127 record di mortalità ognuno corredato dal valore di 11 variabili esplicative. Al fine di permettere all'algoritmo Random Forest di valutare l'importanza di ogni variabile nel descrivere gli eventi di mortalità, è stato quindi creato un database sintetico di non-decessi, a partire dalla distribuzione in frequenza delle variabili esplicative nelle aree colpite dagli eventi alluvionali inclusi nel database di partenza. Quest'ultimo è stato quindi completato con 1270 record di non-decessi per ognuno dei quali è stato valutato il valore delle 11 variabili esplicative. La calibrazione e successiva validazione dell'algoritmo Randon Forest su due set di dati differenti ha portato alla scelta del modello finale caratterizzato da un'accuratezza del 68%. Nondimeno, l'analisi ha permesso di identificare l'importanza delle diverse variabili esplicative per il determinarsi di condizioni di insicurezza, fornendo utili indicazioni per la riduzione e gestione del rischio di morte in caso di alluvione.
2021
random forest
alluvione
machine learning
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/417395
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact