Le ricerche linguistiche a partire dal secondo dopoguerra hanno avuto un ritmo di evoluzione e di espansione molto rapido grazie anche ai metodi di analisi introdotti, come l'uso dei metodi statistici o quantitativi nello studio delle lingue e delle opere letterarie. Nacquero nuovi settori di applicazione, la linguistica incontrò altre scienze e l' interdisciplinarità venne sempre più praticata fino a diventare indispensabile. L'introduzione di sistemi di automazione delle ricerche nelle analisi linguistiche vide la nascita della Linguistica Computazionale LC che mise in connessione lo studio della lingua e l'elaboratore elettronico. Dalla fine degli anni '40 all'inizio degli anni '60 gli utilizzi del calcolo elettronico per l'elaborazione di dati linguistici si articolarono in due filoni principali: - Gli spogli elettronici dei testi che diedero impulso alla lessicografia computazionale, avviata da Padre Roberto Busa nel 1951 con la compilazione delle concordanze dell'opera omnia di Tommaso d'Aquino; - I tentativi di traduzione automatica TA, in inglese machine translation MT, avviati da Weaver nel 1949 con la pubblicazione del memorandum "Translation". La TA divenne da subito nucleo e centro di spinta della LC utlilizzando il calcolatore per trasportare un testo da una lingua naturale all'altra. Il contenuto argomentale dei testi della Biblioteca dell'Istituto di Linguistica Computazionale si sviluppa per lo più sulle tematiche sopra descritte. L'articolo darà enfasi alla terminologia della LC, nella prima parte, quella introduttiva; nella seconda parte saranno fornite informazioni inerenti il patrimonio bibliografico, il software di gestione usato e indicazioni per il recupero informativo; la terza parte andrà a presentare il "Fondo Antonio Zampolli", preziosa collezione di testi, alcuni unici in Italia, nel settore del trattamento automatico della lingua, che va ad arricchire e completare la Biblioteca ILC. In appendice sarà fornita una tabella riassuntiva dei termini estratti dai titoli degli articoli presentati alle conferenze di Linguistica Computazionale COLING, dal 1965 - anno della prima conferenza tenuta a New York - al 2010, conferenza tenuta a Pechino. Trattasi di 23 conferenze internazionali di Linguistica Computazionale, fondamentali nella storia della disciplina. L'estrazione terminologica del corpus COLING è stata operata con gli strumenti di analisi testuale del laboratorio DylanLab dell'Istituto di Linguistica Computazionale.
Lineamenti di Linguistica Computazionale per il recupero informativo
Pardelli;Gabriella
2012
Abstract
Le ricerche linguistiche a partire dal secondo dopoguerra hanno avuto un ritmo di evoluzione e di espansione molto rapido grazie anche ai metodi di analisi introdotti, come l'uso dei metodi statistici o quantitativi nello studio delle lingue e delle opere letterarie. Nacquero nuovi settori di applicazione, la linguistica incontrò altre scienze e l' interdisciplinarità venne sempre più praticata fino a diventare indispensabile. L'introduzione di sistemi di automazione delle ricerche nelle analisi linguistiche vide la nascita della Linguistica Computazionale LC che mise in connessione lo studio della lingua e l'elaboratore elettronico. Dalla fine degli anni '40 all'inizio degli anni '60 gli utilizzi del calcolo elettronico per l'elaborazione di dati linguistici si articolarono in due filoni principali: - Gli spogli elettronici dei testi che diedero impulso alla lessicografia computazionale, avviata da Padre Roberto Busa nel 1951 con la compilazione delle concordanze dell'opera omnia di Tommaso d'Aquino; - I tentativi di traduzione automatica TA, in inglese machine translation MT, avviati da Weaver nel 1949 con la pubblicazione del memorandum "Translation". La TA divenne da subito nucleo e centro di spinta della LC utlilizzando il calcolatore per trasportare un testo da una lingua naturale all'altra. Il contenuto argomentale dei testi della Biblioteca dell'Istituto di Linguistica Computazionale si sviluppa per lo più sulle tematiche sopra descritte. L'articolo darà enfasi alla terminologia della LC, nella prima parte, quella introduttiva; nella seconda parte saranno fornite informazioni inerenti il patrimonio bibliografico, il software di gestione usato e indicazioni per il recupero informativo; la terza parte andrà a presentare il "Fondo Antonio Zampolli", preziosa collezione di testi, alcuni unici in Italia, nel settore del trattamento automatico della lingua, che va ad arricchire e completare la Biblioteca ILC. In appendice sarà fornita una tabella riassuntiva dei termini estratti dai titoli degli articoli presentati alle conferenze di Linguistica Computazionale COLING, dal 1965 - anno della prima conferenza tenuta a New York - al 2010, conferenza tenuta a Pechino. Trattasi di 23 conferenze internazionali di Linguistica Computazionale, fondamentali nella storia della disciplina. L'estrazione terminologica del corpus COLING è stata operata con gli strumenti di analisi testuale del laboratorio DylanLab dell'Istituto di Linguistica Computazionale.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.