The aim of this work is to create an automatic subject classification of grey literature documents using an artificial neural network. In particular, a software simulator of neural network with back-propagation learning scheme was used; training of the network was carried out on around 300 documents. The prototype developed follows the steps which were performed during the learning, the processing and the network querying phase. The analysis of the final tests provides targets to be referred to the percentage of document classification error for each subject. From this data it is possible to evince possible document-subject correlations and/or subject-subject correlations in order to construct a relational Database of the scientific documents available at the Institute of Computational Linguistics and at the Institute of Instrumental Analitical Chemistry.
Scopo di questo lavoro è la soggettazione automatica di documenti di letteratura grigia attraverso l'utilizzo di una rete neurale artificiale. In particolare è stato utilizzato un simulatore software di rete neurale ad apprendimento `back-propagation`; l'addestramento della rete è stato fatto su circa 300 documenti. Il prototipo sviluppato segue gli steps fatti durante l'apprendimento, l'elaborazione dei dati e l'interrogazione della rete. L'analisi dei test finali forniscono targets riferibili alla percentuale di errore di classificazione del documento a ciascun soggetto. Da questi dati, inoltre, è possibile dedurre eventuali correlazioni documento-soggetto e/o correlazioni soggetto-soggetto in modo da costruire una Banca Dati relazionata sui documenti scientifici posseduti dall'Istituto di Linguistica Computazionale e dall'Istituto di Chimica Analitica Strumentale
Una soggettazione automatica di letteratura grigia con algoritmi di rete neurale artificiale. Due esperimenti ICAS e ILC
Lanza Clara;Pardelli Gabriella
2000
Abstract
The aim of this work is to create an automatic subject classification of grey literature documents using an artificial neural network. In particular, a software simulator of neural network with back-propagation learning scheme was used; training of the network was carried out on around 300 documents. The prototype developed follows the steps which were performed during the learning, the processing and the network querying phase. The analysis of the final tests provides targets to be referred to the percentage of document classification error for each subject. From this data it is possible to evince possible document-subject correlations and/or subject-subject correlations in order to construct a relational Database of the scientific documents available at the Institute of Computational Linguistics and at the Institute of Instrumental Analitical Chemistry.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.