The paper aims to address the problem of image classification using deep learning algorithms. The main objective is to develop an accurate and efficient classification system that can automatically recognize and categorize images into different classes. To achieve this goal, various technologies and methodologies have been utilized. Specifically, Convolutional Neural Networks (CNNs) that provide the convolution operation, pretrained ResNet that enable the use of transfer learning strategy, serving as a starting point for training new networks, and the fine-tuning approach for refining the ResNet. As the models' development progressed, there was a gradual improvement in accuracy and a reduction in validation loss. This, along with the inference results, demonstrates that the techniques used have led to a significant enhancement in overall performance. It has been shown that CNNs are particularly effective in image classification, and the skillful combination of data preprocessing techniques, regularization techniques (such as early stopping, data augmentation, dropout, and batch normalization), and parameter optimization techniques (such as ADAM) leads to a significant improvement in the performance of classification models. These results can be applied in the field of automatic comic generation. By utilizing an image classification model to recognize key elements, one can leverage this information to automatically generate comics based on the recognized elements.
L’elaborato si propone di affrontare il problema della classificazione di immagini utilizzando algoritmi di deep learning. L'obiettivo principale è quello di sviluppare un sistema di classificazione preciso ed efficiente che possa riconoscere e categorizzare automaticamente le immagini in diverse classi. Per raggiungere l’obiettivo sono state sfruttate diverse tecnologie e metodologie. In particolare, le Convolutional Neural Network (CNN) che mettono a disposizione l’operazione di convoluzione, le ResNet pre-addestrate che consentono di utilizzare una strategia di transfer learning che fornisce un punto di partenza per l'addestramento di nuove reti e l’approccio fine-tuning per il raffinamento delle ResNet. Andando avanti nello sviluppo dei modelli ci si è trovati di fronte a un graduale miglioramento dell’accuratezza e ad una riduzione della perdita in validazione. Ciò, contestualmente ai risultati dell’inferenza, sta a dimostrare che le tecniche utilizzate hanno permesso un sensibile miglioramento delle prestazioni generali. Si è dimostrato dunque che le CNN sono particolarmente efficaci nella classificazione di immagini e che la sapiente combinazione di tecniche di pre-processing dei dati, di tecniche di regolarizzazione (come early stopping, data augmentation, dropout e batch normalization) e di tecniche di ottimizzazione dei parametri (come ADAM) portano a un significativo miglioramento delle prestazioni dei modelli di classificazione. Questi risultati possono essere applicati nel campo di studio della generazione automatica di fumetti, infatti utilizzando un modello di classificazione delle immagini per riconoscere in esse elementi chiave è possibile sfruttare queste informazioni per generare automaticamente fumetti che si basano sugli elementi riconosciuti
Ottimizzazione di Reti Neurali per Image Classification / Manna, Alessandro. - (2023 Jul 27).
Ottimizzazione di Reti Neurali per Image Classification
alessandro mannaPrimo
2023
Abstract
The paper aims to address the problem of image classification using deep learning algorithms. The main objective is to develop an accurate and efficient classification system that can automatically recognize and categorize images into different classes. To achieve this goal, various technologies and methodologies have been utilized. Specifically, Convolutional Neural Networks (CNNs) that provide the convolution operation, pretrained ResNet that enable the use of transfer learning strategy, serving as a starting point for training new networks, and the fine-tuning approach for refining the ResNet. As the models' development progressed, there was a gradual improvement in accuracy and a reduction in validation loss. This, along with the inference results, demonstrates that the techniques used have led to a significant enhancement in overall performance. It has been shown that CNNs are particularly effective in image classification, and the skillful combination of data preprocessing techniques, regularization techniques (such as early stopping, data augmentation, dropout, and batch normalization), and parameter optimization techniques (such as ADAM) leads to a significant improvement in the performance of classification models. These results can be applied in the field of automatic comic generation. By utilizing an image classification model to recognize key elements, one can leverage this information to automatically generate comics based on the recognized elements.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.