Il tirocinio è stato svolto presso l'Istituto di Scienza e Tecnologie dell'Informazione del Consiglio Nazionale delle Ricerche, nel laboratorio di S&I (Segnali e Immagini) Il lavoro ha avuto la durata di 300 ore, svolte tra luglio e novembre del 2023.Il progetto a cui si è partecipato si poneva l'obiettivo di sviluppare un'applicazione per soggetti ipoacusici, che permettesse di utilizzare il proprio telefono, munito di auricolari, come ausilio in situazioni quotidiane, come comprendere meglio il proprio interlocutore o seguire una lezione Sfruttando il potere di calcolo del dispositivo, si voleva mettere a disposizione dell'utente un'elaborazione del segnale in tempo reale, possibilmente al livello di quella fornita dall'apparecchio acustico, implementando anche funzionalità aggiuntive Si voleva fornire, infatti, la possibilità di ridurre il rumore di fondo e ottimizzare il suono rispetto al tipo di patologia dell'utente, integrando anche, mediante l'ausilio dell'intelligenza artificiale, un'equalizzazione specifica a seconda del tipo di interlocutoreNel corso del tirocinio, ci si è concentrati sullo studio e l'analisi dei segnali audio In particolare, è stata esplorata l'applicazione della trasformata di Fourier e di tecniche di filtraggio per scomporre segnali complessi nelle loro componenti in frequenza, in modo da identificarne le caratteristiche distintive e le componenti fondamentali Questo processo ha permesso di manipolarli al fine di migliorarne la qualità, ad esempio, riducendo il rumore di fondo indesiderato o migliorando l'intelligibilità del parlato.Inoltre, sono stati approfonditi gli argomenti di intelligenza artificiale già appresi durante il corso degli studi Nello specifico, studiando il campo del deep learning, si è valutato l'utilizzo delle reti neurali convoluzionali residuali per la classificazione dei segnali audio a seconda di alcune loro caratteristiche specifiche.Nel laboratorio S&I, in passato, sono stati sviluppati altri progetti nell'ambito dell'acustica, basati sull'uso di microprocessori per DSP Realizzando apparati per il controllo attivo del rumore e di schede aggiunte a Personal Computer per strumentazione audiometrica In particolare, era stato sviluppato un sistema basato su un piccolo Kit DSP commerciale programmabile per migliorare l'ascolto della musica da parte di soggetti ipoacusici, rimasto a livello prototipale.Il progetto attuale riguardante il tirocinio, si è basato sull'idea di sfruttare le sempre più potenti architetture di calcolo presenti sui dispositivi mobile, ormai alla portata di gran parte della popolazione, e più performanti di quelle presenti nelle protesi acustiche, per fornire un alternativa a basso costo ai soggetti ipoacusici.L'ipoacusia, ovvero la perdita o la diminuzione della capacità di udire, rappresenta una sfida significativa per un ampia fetta della popolazione Infatti, secondo le analisi dell'AIRS (Associazione Italiana Ricerca Sordità) , si stima che in Italia si abbia una prevalenza dei problemi uditivi nel 12, 1% della popolazione e che, dunque, circa 7 milioni di italiani soffrano di questo tipo di patologie Tutte le fasce di età sono suscettibili ai disturbi dell'udito, ma si nota un significativo aumento con il progredire dell'età (da percentuali che non superano il 10% della classe di età 13 - 45 anni al 25% di chi ha dai 61 agli 80 anni, fino al 50% tra gli over 80).Questa condizione impatta non solo sulla capacità uditiva, ma può anche influire sullo stato mentale e sociale di un individuo Infatti, spesso può generare isolamento sociale e difficoltà nell'ambito educativo e lavorativo Tuttavia, nonostante i disagi causati da tali disturbi e la loro alta diffusione, secondo i dati di un indagine di Anovum EuroTrak 2018 relativa all'Italia , solo il 29, 5% dei soggetti ipoacusici fa uso di protesi acustiche Infatti, a causa degli elevati costi delle protesi, dei pregiudizi e della tendenza a sminuire il proprio stato di salute, spesso si sceglie di convivere con il disturbo piuttosto che curarlo.Rendere disponibile un'applicazione che permetta di migliorare ed equalizzare il suono ambientale, simulando il funzionamento di una protesi acustica ed integrandola inoltre con altre funzionalità di accessibilità come la trascrizione automatica, può portare benefici a coloro che soffrono di questa patologia, offrendo loro un'alternativa a basso costo e facilmente accessibile.Nello specifico, durante lo svolgimento del tirocinio, si è contribuito sviluppando il prototipo di un'applicazione Android, installabile su qualsiasi dispositivo con tale sistema operativo, concentrandosi sulla parte di elaborazione e ottimizzazione dell'audio e dimostrando la possibilità di integrare tecniche di intelligenza artificiale.Si è scelto, quindi, anche in relazione anche alle tempistiche del tirocinio, di dare la priorità alla creazione di un prototipo funzionante che avesse le basi per tutte le funzionalità proposte e che dimostrasse la fattibilità dell'utilizzo di tali tecnologie, senza concentrarsi esclusivamente sullo sviluppo di una singola componente In modo cos?? da poter fornire una panoramica più ampia, lasciando spazio alla possibilità di ampliare le singole componenti in futuro.Per questo motivo, si è deciso di impiegare un modello di classificazione meno complessa Infatti, la rete neurale integrata nei prototipi, si limita a classificare il genere del parlante ed utilizzare il risultato per migliorare l'equalizzazione dell'audio Si potrebbero, tuttavia, trovare diversi utilizzi per questo tipo di tecnologia, ad esempio, includendo modelli più complessi per la classificazione dei rumori di fondo o identificazione di uno specifico individuo, per ottimizzare ulteriormente la qualità del segnale, o inserire altre opzioni di accessibilità, come dimostrato in parte dalla funzionalità speech to text dell'applicazione.Il lavoro è stato svolto principalmente utilizzando il linguaggio Python per l'elaborazione audio e la creazione del modello classificatore, ma anche per implementare i due prototipi dell'applicazione Si è infatti scelto di utilizzare il framework per lo sviluppo di applicazioni mobile in Python, Kivy.Al termine del tirocinio sono stati realizzati due prototipi dell'applicazione Il primo permette di elaborare delle registrazioni audio, enfatizzando la massima qualità dell'output Mentre, il secondo, mira a dimostrare la praticità dell'applicazione, realizzando una versione con elaborazione in tempo reale dell'audio, funzionale in ambienti dinamici, con rumori di fondo o in presenza di più di un interlocutoreSi è raggiunto cos?? l'obiettivo principale che ci si era prefissati, ovvero creare un sistema che l'utente potesse utilizzare anche in situazioni quotidiane e che potesse adattare alle proprie necessità uditiveRimangono, tuttavia, varie opportunità di miglioramento ancora esplorabili Come, ad esempio, l'integrazione di tecniche di intelligenza artificiale più avanzate, possibilmente con l'elaborazione dell'audio affidata a server esterni, al fine di potenziare ulteriormente le capacità dell'applicazione Inoltre, rispetto alla proposta iniziale di tirocinio, per ragioni di privacy e sicurezza degli utenti, non è stato possibile condurre test su soggetti affetti da ipoacusia

IA in prototipo audio-protesico Android / Sava, A autore; Bacciu, D relatore; Bruschini, L relatore; Righi, M relatore. - (2023).

IA in prototipo audio-protesico Android

2023

Abstract

Il tirocinio è stato svolto presso l'Istituto di Scienza e Tecnologie dell'Informazione del Consiglio Nazionale delle Ricerche, nel laboratorio di S&I (Segnali e Immagini) Il lavoro ha avuto la durata di 300 ore, svolte tra luglio e novembre del 2023.Il progetto a cui si è partecipato si poneva l'obiettivo di sviluppare un'applicazione per soggetti ipoacusici, che permettesse di utilizzare il proprio telefono, munito di auricolari, come ausilio in situazioni quotidiane, come comprendere meglio il proprio interlocutore o seguire una lezione Sfruttando il potere di calcolo del dispositivo, si voleva mettere a disposizione dell'utente un'elaborazione del segnale in tempo reale, possibilmente al livello di quella fornita dall'apparecchio acustico, implementando anche funzionalità aggiuntive Si voleva fornire, infatti, la possibilità di ridurre il rumore di fondo e ottimizzare il suono rispetto al tipo di patologia dell'utente, integrando anche, mediante l'ausilio dell'intelligenza artificiale, un'equalizzazione specifica a seconda del tipo di interlocutoreNel corso del tirocinio, ci si è concentrati sullo studio e l'analisi dei segnali audio In particolare, è stata esplorata l'applicazione della trasformata di Fourier e di tecniche di filtraggio per scomporre segnali complessi nelle loro componenti in frequenza, in modo da identificarne le caratteristiche distintive e le componenti fondamentali Questo processo ha permesso di manipolarli al fine di migliorarne la qualità, ad esempio, riducendo il rumore di fondo indesiderato o migliorando l'intelligibilità del parlato.Inoltre, sono stati approfonditi gli argomenti di intelligenza artificiale già appresi durante il corso degli studi Nello specifico, studiando il campo del deep learning, si è valutato l'utilizzo delle reti neurali convoluzionali residuali per la classificazione dei segnali audio a seconda di alcune loro caratteristiche specifiche.Nel laboratorio S&I, in passato, sono stati sviluppati altri progetti nell'ambito dell'acustica, basati sull'uso di microprocessori per DSP Realizzando apparati per il controllo attivo del rumore e di schede aggiunte a Personal Computer per strumentazione audiometrica In particolare, era stato sviluppato un sistema basato su un piccolo Kit DSP commerciale programmabile per migliorare l'ascolto della musica da parte di soggetti ipoacusici, rimasto a livello prototipale.Il progetto attuale riguardante il tirocinio, si è basato sull'idea di sfruttare le sempre più potenti architetture di calcolo presenti sui dispositivi mobile, ormai alla portata di gran parte della popolazione, e più performanti di quelle presenti nelle protesi acustiche, per fornire un alternativa a basso costo ai soggetti ipoacusici.L'ipoacusia, ovvero la perdita o la diminuzione della capacità di udire, rappresenta una sfida significativa per un ampia fetta della popolazione Infatti, secondo le analisi dell'AIRS (Associazione Italiana Ricerca Sordità) , si stima che in Italia si abbia una prevalenza dei problemi uditivi nel 12, 1% della popolazione e che, dunque, circa 7 milioni di italiani soffrano di questo tipo di patologie Tutte le fasce di età sono suscettibili ai disturbi dell'udito, ma si nota un significativo aumento con il progredire dell'età (da percentuali che non superano il 10% della classe di età 13 - 45 anni al 25% di chi ha dai 61 agli 80 anni, fino al 50% tra gli over 80).Questa condizione impatta non solo sulla capacità uditiva, ma può anche influire sullo stato mentale e sociale di un individuo Infatti, spesso può generare isolamento sociale e difficoltà nell'ambito educativo e lavorativo Tuttavia, nonostante i disagi causati da tali disturbi e la loro alta diffusione, secondo i dati di un indagine di Anovum EuroTrak 2018 relativa all'Italia , solo il 29, 5% dei soggetti ipoacusici fa uso di protesi acustiche Infatti, a causa degli elevati costi delle protesi, dei pregiudizi e della tendenza a sminuire il proprio stato di salute, spesso si sceglie di convivere con il disturbo piuttosto che curarlo.Rendere disponibile un'applicazione che permetta di migliorare ed equalizzare il suono ambientale, simulando il funzionamento di una protesi acustica ed integrandola inoltre con altre funzionalità di accessibilità come la trascrizione automatica, può portare benefici a coloro che soffrono di questa patologia, offrendo loro un'alternativa a basso costo e facilmente accessibile.Nello specifico, durante lo svolgimento del tirocinio, si è contribuito sviluppando il prototipo di un'applicazione Android, installabile su qualsiasi dispositivo con tale sistema operativo, concentrandosi sulla parte di elaborazione e ottimizzazione dell'audio e dimostrando la possibilità di integrare tecniche di intelligenza artificiale.Si è scelto, quindi, anche in relazione anche alle tempistiche del tirocinio, di dare la priorità alla creazione di un prototipo funzionante che avesse le basi per tutte le funzionalità proposte e che dimostrasse la fattibilità dell'utilizzo di tali tecnologie, senza concentrarsi esclusivamente sullo sviluppo di una singola componente In modo cos?? da poter fornire una panoramica più ampia, lasciando spazio alla possibilità di ampliare le singole componenti in futuro.Per questo motivo, si è deciso di impiegare un modello di classificazione meno complessa Infatti, la rete neurale integrata nei prototipi, si limita a classificare il genere del parlante ed utilizzare il risultato per migliorare l'equalizzazione dell'audio Si potrebbero, tuttavia, trovare diversi utilizzi per questo tipo di tecnologia, ad esempio, includendo modelli più complessi per la classificazione dei rumori di fondo o identificazione di uno specifico individuo, per ottimizzare ulteriormente la qualità del segnale, o inserire altre opzioni di accessibilità, come dimostrato in parte dalla funzionalità speech to text dell'applicazione.Il lavoro è stato svolto principalmente utilizzando il linguaggio Python per l'elaborazione audio e la creazione del modello classificatore, ma anche per implementare i due prototipi dell'applicazione Si è infatti scelto di utilizzare il framework per lo sviluppo di applicazioni mobile in Python, Kivy.Al termine del tirocinio sono stati realizzati due prototipi dell'applicazione Il primo permette di elaborare delle registrazioni audio, enfatizzando la massima qualità dell'output Mentre, il secondo, mira a dimostrare la praticità dell'applicazione, realizzando una versione con elaborazione in tempo reale dell'audio, funzionale in ambienti dinamici, con rumori di fondo o in presenza di più di un interlocutoreSi è raggiunto cos?? l'obiettivo principale che ci si era prefissati, ovvero creare un sistema che l'utente potesse utilizzare anche in situazioni quotidiane e che potesse adattare alle proprie necessità uditiveRimangono, tuttavia, varie opportunità di miglioramento ancora esplorabili Come, ad esempio, l'integrazione di tecniche di intelligenza artificiale più avanzate, possibilmente con l'elaborazione dell'audio affidata a server esterni, al fine di potenziare ulteriormente le capacità dell'applicazione Inoltre, rispetto alla proposta iniziale di tirocinio, per ragioni di privacy e sicurezza degli utenti, non è stato possibile condurre test su soggetti affetti da ipoacusia
2023
Istituto di Scienza e Tecnologie dell'Informazione "Alessandro Faedo" - ISTI
Intelligenza artificiale
Protesi
Protesi acustica
Analisi dei segnali
Eliminazione del rumore
Trasformata di Fourirer
FIR
Real-time
Marco Righi
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/449767
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact