Questo documento riporta il resoconto delle attività dello studente Davide Bulotta du- rante il tirocinio extracurriculare svolto presso lo Istituto di Scienza e Tecnologia dell’Informazione nel periodo Aprile 2024 - Marzo 2025. Il tirocinio è connesso con il progetto europeo F.A.I.T.H. (Fostering Artificial Intelligence Trust for Humans)[1], il cui obiettivo è quello di definire ed implementare degli strumenti ad hoc (FAITH Risk Management Framework) per misurare e migliorare l’affidabilità dei sistemi che utilizzano modelli di Intelligenza Artificiale (IA). Tale Framework è implementato, dimostrato e perfezionato tramite una selezione rappresentativa di sette progetti pilota su larga scala in ambiti critici, tra cui la mobilità nel trasporto pubblico. Lo ISTC-CNR si occupa di quest’ultimo dominio ed in particolare dell’utilizzo di sistemi di visione artificiale a bordo di treni regionali del vet- tore nazionale Trenitalia. Si opera in un ambiente in cui non è possibile ingegnerizzare al meglio la scena e vi è il divieto di effettuare registrazioni per rispetto del GDPR (ovvero le registrazioni effettuate sono visionabili solo da autorità di pubblica sicurezza). Lo studio effettuato affronta le sfide teoriche e implementative associate all’implementazione di sistemi di visione artificiale in domini caratterizzati da elevata scarsità di dati e rigidi vincoli hardware. Il fulcro della ricerca propone una metodologia semi-supervisionata definita “Zero-shot Annotation Coaching”, che formalizza una pipeline di distillazione della conoscenza. In questo contesto, un rilevatore di vocabolario aperto basato su Vision Transformer, in particolare OWLv2, funge da modello “insegnante”, sfruttando le sue capacità di generalizzazione semantica per generare pseudo-etichette da flussi video non annotati. Questo processo trasferisce efficacemente la comprensione semantica dell’architettura del trasformatore in un set di dati strutturato, consentendo l’addestramento supervisionato di un modello “studente”, YOLOv8, ottimizzato architettonicamente per l’inferenza a bassa latenza piuttosto che per l’ampiezza semantica open-world.
Tecniche di creazione dataset e modelli IA in regime di scarsità dei dati
Bulotta D.Conceptualization
;Del Corso G.;Leone G. R.
2025
Abstract
Questo documento riporta il resoconto delle attività dello studente Davide Bulotta du- rante il tirocinio extracurriculare svolto presso lo Istituto di Scienza e Tecnologia dell’Informazione nel periodo Aprile 2024 - Marzo 2025. Il tirocinio è connesso con il progetto europeo F.A.I.T.H. (Fostering Artificial Intelligence Trust for Humans)[1], il cui obiettivo è quello di definire ed implementare degli strumenti ad hoc (FAITH Risk Management Framework) per misurare e migliorare l’affidabilità dei sistemi che utilizzano modelli di Intelligenza Artificiale (IA). Tale Framework è implementato, dimostrato e perfezionato tramite una selezione rappresentativa di sette progetti pilota su larga scala in ambiti critici, tra cui la mobilità nel trasporto pubblico. Lo ISTC-CNR si occupa di quest’ultimo dominio ed in particolare dell’utilizzo di sistemi di visione artificiale a bordo di treni regionali del vet- tore nazionale Trenitalia. Si opera in un ambiente in cui non è possibile ingegnerizzare al meglio la scena e vi è il divieto di effettuare registrazioni per rispetto del GDPR (ovvero le registrazioni effettuate sono visionabili solo da autorità di pubblica sicurezza). Lo studio effettuato affronta le sfide teoriche e implementative associate all’implementazione di sistemi di visione artificiale in domini caratterizzati da elevata scarsità di dati e rigidi vincoli hardware. Il fulcro della ricerca propone una metodologia semi-supervisionata definita “Zero-shot Annotation Coaching”, che formalizza una pipeline di distillazione della conoscenza. In questo contesto, un rilevatore di vocabolario aperto basato su Vision Transformer, in particolare OWLv2, funge da modello “insegnante”, sfruttando le sue capacità di generalizzazione semantica per generare pseudo-etichette da flussi video non annotati. Questo processo trasferisce efficacemente la comprensione semantica dell’architettura del trasformatore in un set di dati strutturato, consentendo l’addestramento supervisionato di un modello “studente”, YOLOv8, ottimizzato architettonicamente per l’inferenza a bassa latenza piuttosto che per l’ampiezza semantica open-world.| File | Dimensione | Formato | |
|---|---|---|---|
|
TechReport Bulotta.pdf
accesso aperto
Descrizione: Rapporto tecnico del tirocino extracurriculare di Davide Bulotta
Tipologia:
Documento in Pre-print
Licenza:
Creative commons
Dimensione
3.15 MB
Formato
Adobe PDF
|
3.15 MB | Adobe PDF | Visualizza/Apri |
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.


