Questo documento riporta il resoconto delle attività dello studente Davide Bulotta du- rante il tirocinio extracurriculare svolto presso lo Istituto di Scienza e Tecnologia dell’Informazione nel periodo Aprile 2024 - Marzo 2025. Il tirocinio è connesso con il progetto europeo F.A.I.T.H. (Fostering Artificial Intelligence Trust for Humans)[1], il cui obiettivo è quello di definire ed implementare degli strumenti ad hoc (FAITH Risk Management Framework) per misurare e migliorare l’affidabilità dei sistemi che utilizzano modelli di Intelligenza Artificiale (IA). Tale Framework è implementato, dimostrato e perfezionato tramite una selezione rappresentativa di sette progetti pilota su larga scala in ambiti critici, tra cui la mobilità nel trasporto pubblico. Lo ISTC-CNR si occupa di quest’ultimo dominio ed in particolare dell’utilizzo di sistemi di visione artificiale a bordo di treni regionali del vet- tore nazionale Trenitalia. Si opera in un ambiente in cui non è possibile ingegnerizzare al meglio la scena e vi è il divieto di effettuare registrazioni per rispetto del GDPR (ovvero le registrazioni effettuate sono visionabili solo da autorità di pubblica sicurezza). Lo studio effettuato affronta le sfide teoriche e implementative associate all’implementazione di sistemi di visione artificiale in domini caratterizzati da elevata scarsità di dati e rigidi vincoli hardware. Il fulcro della ricerca propone una metodologia semi-supervisionata definita “Zero-shot Annotation Coaching”, che formalizza una pipeline di distillazione della conoscenza. In questo contesto, un rilevatore di vocabolario aperto basato su Vision Transformer, in particolare OWLv2, funge da modello “insegnante”, sfruttando le sue capacità di generalizzazione semantica per generare pseudo-etichette da flussi video non annotati. Questo processo trasferisce efficacemente la comprensione semantica dell’architettura del trasformatore in un set di dati strutturato, consentendo l’addestramento supervisionato di un modello “studente”, YOLOv8, ottimizzato architettonicamente per l’inferenza a bassa latenza piuttosto che per l’ampiezza semantica open-world.

Tecniche di creazione dataset e modelli IA in regime di scarsità dei dati

Bulotta D.
Conceptualization
;
Del Corso G.;Leone G. R.
2025

Abstract

Questo documento riporta il resoconto delle attività dello studente Davide Bulotta du- rante il tirocinio extracurriculare svolto presso lo Istituto di Scienza e Tecnologia dell’Informazione nel periodo Aprile 2024 - Marzo 2025. Il tirocinio è connesso con il progetto europeo F.A.I.T.H. (Fostering Artificial Intelligence Trust for Humans)[1], il cui obiettivo è quello di definire ed implementare degli strumenti ad hoc (FAITH Risk Management Framework) per misurare e migliorare l’affidabilità dei sistemi che utilizzano modelli di Intelligenza Artificiale (IA). Tale Framework è implementato, dimostrato e perfezionato tramite una selezione rappresentativa di sette progetti pilota su larga scala in ambiti critici, tra cui la mobilità nel trasporto pubblico. Lo ISTC-CNR si occupa di quest’ultimo dominio ed in particolare dell’utilizzo di sistemi di visione artificiale a bordo di treni regionali del vet- tore nazionale Trenitalia. Si opera in un ambiente in cui non è possibile ingegnerizzare al meglio la scena e vi è il divieto di effettuare registrazioni per rispetto del GDPR (ovvero le registrazioni effettuate sono visionabili solo da autorità di pubblica sicurezza). Lo studio effettuato affronta le sfide teoriche e implementative associate all’implementazione di sistemi di visione artificiale in domini caratterizzati da elevata scarsità di dati e rigidi vincoli hardware. Il fulcro della ricerca propone una metodologia semi-supervisionata definita “Zero-shot Annotation Coaching”, che formalizza una pipeline di distillazione della conoscenza. In questo contesto, un rilevatore di vocabolario aperto basato su Vision Transformer, in particolare OWLv2, funge da modello “insegnante”, sfruttando le sue capacità di generalizzazione semantica per generare pseudo-etichette da flussi video non annotati. Questo processo trasferisce efficacemente la comprensione semantica dell’architettura del trasformatore in un set di dati strutturato, consentendo l’addestramento supervisionato di un modello “studente”, YOLOv8, ottimizzato architettonicamente per l’inferenza a bassa latenza piuttosto che per l’ampiezza semantica open-world.
2025
Istituto di Scienza e Tecnologie dell'Informazione "Alessandro Faedo" - ISTI
Data scarcity, Zero-shot annotation, Trustworthy AI, AIPassport, Deepstream, DGX
File in questo prodotto:
File Dimensione Formato  
TechReport Bulotta.pdf

accesso aperto

Descrizione: Rapporto tecnico del tirocino extracurriculare di Davide Bulotta
Tipologia: Documento in Pre-print
Licenza: Creative commons
Dimensione 3.15 MB
Formato Adobe PDF
3.15 MB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/573942
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact