CNR Institutional Research Information System

Questo documento riporta il resoconto delle attività dello studente Davide Bulotta du- rante il tirocinio extracurriculare svolto presso lo Istituto di Scienza e Tecnologia dell’Informazione nel periodo Aprile 2024 - Marzo 2025. Il tirocinio è connesso con il progetto europeo F.A.I.T.H. (Fostering Artificial Intelligence Trust for Humans)[1], il cui obiettivo è quello di definire ed implementare degli strumenti ad hoc (FAITH Risk Management Framework) per misurare e migliorare l’affidabilità dei sistemi che utilizzano modelli di Intelligenza Artificiale (IA). Tale Framework è implementato, dimostrato e perfezionato tramite una selezione rappresentativa di sette progetti pilota su larga scala in ambiti critici, tra cui la mobilità nel trasporto pubblico. Lo ISTC-CNR si occupa di quest’ultimo dominio ed in particolare dell’utilizzo di sistemi di visione artificiale a bordo di treni regionali del vet- tore nazionale Trenitalia. Si opera in un ambiente in cui non è possibile ingegnerizzare al meglio la scena e vi è il divieto di effettuare registrazioni per rispetto del GDPR (ovvero le registrazioni effettuate sono visionabili solo da autorità di pubblica sicurezza). Lo studio effettuato affronta le sfide teoriche e implementative associate all’implementazione di sistemi di visione artificiale in domini caratterizzati da elevata scarsità di dati e rigidi vincoli hardware. Il fulcro della ricerca propone una metodologia semi-supervisionata definita “Zero-shot Annotation Coaching”, che formalizza una pipeline di distillazione della conoscenza. In questo contesto, un rilevatore di vocabolario aperto basato su Vision Transformer, in particolare OWLv2, funge da modello “insegnante”, sfruttando le sue capacità di generalizzazione semantica per generare pseudo-etichette da flussi video non annotati. Questo processo trasferisce efficacemente la comprensione semantica dell’architettura del trasformatore in un set di dati strutturato, consentendo l’addestramento supervisionato di un modello “studente”, YOLOv8, ottimizzato architettonicamente per l’inferenza a bassa latenza piuttosto che per l’ampiezza semantica open-world.

Tecniche di creazione dataset e modelli IA in regime di scarsità dei dati

Bulotta D.^{Conceptualization};Del Corso G.;Leone G. R.

2025

Abstract

Questo documento riporta il resoconto delle attività dello studente Davide Bulotta du- rante il tirocinio extracurriculare svolto presso lo Istituto di Scienza e Tecnologia dell’Informazione nel periodo Aprile 2024 - Marzo 2025. Il tirocinio è connesso con il progetto europeo F.A.I.T.H. (Fostering Artificial Intelligence Trust for Humans)[1], il cui obiettivo è quello di definire ed implementare degli strumenti ad hoc (FAITH Risk Management Framework) per misurare e migliorare l’affidabilità dei sistemi che utilizzano modelli di Intelligenza Artificiale (IA). Tale Framework è implementato, dimostrato e perfezionato tramite una selezione rappresentativa di sette progetti pilota su larga scala in ambiti critici, tra cui la mobilità nel trasporto pubblico. Lo ISTC-CNR si occupa di quest’ultimo dominio ed in particolare dell’utilizzo di sistemi di visione artificiale a bordo di treni regionali del vet- tore nazionale Trenitalia. Si opera in un ambiente in cui non è possibile ingegnerizzare al meglio la scena e vi è il divieto di effettuare registrazioni per rispetto del GDPR (ovvero le registrazioni effettuate sono visionabili solo da autorità di pubblica sicurezza). Lo studio effettuato affronta le sfide teoriche e implementative associate all’implementazione di sistemi di visione artificiale in domini caratterizzati da elevata scarsità di dati e rigidi vincoli hardware. Il fulcro della ricerca propone una metodologia semi-supervisionata definita “Zero-shot Annotation Coaching”, che formalizza una pipeline di distillazione della conoscenza. In questo contesto, un rilevatore di vocabolario aperto basato su Vision Transformer, in particolare OWLv2, funge da modello “insegnante”, sfruttando le sue capacità di generalizzazione semantica per generare pseudo-etichette da flussi video non annotati. Questo processo trasferisce efficacemente la comprensione semantica dell’architettura del trasformatore in un set di dati strutturato, consentendo l’addestramento supervisionato di un modello “studente”, YOLOv8, ottimizzato architettonicamente per l’inferenza a bassa latenza piuttosto che per l’ampiezza semantica open-world.

Scheda breve

Scheda completa

Scheda completa (DC)

	Anno
	
				2025
			
	Strutture organizzative
	
				Istituto di Scienza e Tecnologie dell'Informazione "Alessandro Faedo" - ISTI
			
	Parole chiave
	
				Data scarcity, Zero-shot annotation, Trustworthy AI, AIPassport, Deepstream, DGX

File in questo prodotto:

File	Dimensione	Formato
TechReport Bulotta.pdf accesso aperto Descrizione: Rapporto tecnico del tirocino extracurriculare di Davide Bulotta Tipologia: Documento in Pre-print Licenza: Creative commons Dimensione 3.15 MB Formato Adobe PDF Visualizza/Apri	3.15 MB	Adobe PDF	Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/573942

Citazioni

ND

ND

ND

social impact