La "legimatica", si occupa del trattamento dell'informazione legislativa e ha per scopo l'informatizzazione del processo di produzione normativa. L'Istituto di Teoria e Tecniche dell'Informazione Giuridica del CNR è stato tra i precursori di questa disciplina. In particolare in ITTIG si conducono, tra le altre, ricerche finalizzate alla definizione, descrizione e formalizzazione di modelli di strutture di testi normativi in base a regole linguistiche e giuridiche per il riconoscimento automatico e l'analisi del linguaggio dei testi normativi stessi. Questo tipo di ricerca, nata in primo luogo, dall'esigenza di molte istituzioni di convertire le loro informazioni giuridiche, specie le leggi, in un formato standard per facilitarne la ricerca e la comunicazione nel WEB, vede oggi notevoli possibilità applicative sia per il consolidamento e coordinamento dei testi normativi sia per la generazione, valutazione e controllo degli stessi testi. Lo standard tecnico necessario per tale conversione e per le applicazioni conseguenti è stato individuato nel linguaggio di marcatura XML. Il linguaggio XML (eXtensible Markup Language) consente infatti il trasferimento di conoscenza anche semantica al computer, attraverso l'introduzione nei testi di codici o marcatori, che risultano leggibili e comprensibili anche dalla macchina per mezzo di una apposita grammatica che associa ad ogni marcatore un determinato significato. La definizione di questo insieme di regole richiede la costruzione di un modello di riferimento semantico-strutturale o DTD (Document Type Definition) della classe di documenti che si vuol marcare. Tuttavia la marcatura XML è attività che, se fatta manualmente, risulta lunga e dispendiosa, per di più l'ambiguità e l'indeterminatezza del linguaggio naturale fa si che i singoli documenti si distanzino spesso dal modello definito, aggravando ulteriormente il lavoro di marcatura. Questa peculiarità del linguaggio espone il metodo di marcatura ad altri due pericoli: 1.non riuscire a cogliere tale ambiguità ed indeterminatezza, 2.piegare il significato testuale all'esigenza di utilizzo di tale marcatura. Per tentare di ovviare a questi problemi si può agire in una duplice direzione: sviluppare strumenti di Natural Language Processing (NLP) che consentano il riconoscimento del testo e la sua marcatura automatica anche se le strutture testuali si distanziano dal modello. Tale marcatura infatti, difficilmente ottenibile dal redattore dei testi, in quanto estranea ai compiti e alle finalità della sua attività, se attuata da altri operatori con interventi successivi provoca (ed in alcuni casi ha già provocato) una dilatazione, spesso insostenibile, nei tempi e costi; stabilire degli standard linguistico documentari (regole di scrittura dei documenti) che rendano più omogenee, coerenti e puntuali le strutture dei documenti e quindi consentano alla macchina di riconoscere più agevolmente le strutture standardizzate.

Strumenti informatici per l'analisi e il controllo linguistico dei testi legislativi ed amministrativi

Romano F
2006

Abstract

La "legimatica", si occupa del trattamento dell'informazione legislativa e ha per scopo l'informatizzazione del processo di produzione normativa. L'Istituto di Teoria e Tecniche dell'Informazione Giuridica del CNR è stato tra i precursori di questa disciplina. In particolare in ITTIG si conducono, tra le altre, ricerche finalizzate alla definizione, descrizione e formalizzazione di modelli di strutture di testi normativi in base a regole linguistiche e giuridiche per il riconoscimento automatico e l'analisi del linguaggio dei testi normativi stessi. Questo tipo di ricerca, nata in primo luogo, dall'esigenza di molte istituzioni di convertire le loro informazioni giuridiche, specie le leggi, in un formato standard per facilitarne la ricerca e la comunicazione nel WEB, vede oggi notevoli possibilità applicative sia per il consolidamento e coordinamento dei testi normativi sia per la generazione, valutazione e controllo degli stessi testi. Lo standard tecnico necessario per tale conversione e per le applicazioni conseguenti è stato individuato nel linguaggio di marcatura XML. Il linguaggio XML (eXtensible Markup Language) consente infatti il trasferimento di conoscenza anche semantica al computer, attraverso l'introduzione nei testi di codici o marcatori, che risultano leggibili e comprensibili anche dalla macchina per mezzo di una apposita grammatica che associa ad ogni marcatore un determinato significato. La definizione di questo insieme di regole richiede la costruzione di un modello di riferimento semantico-strutturale o DTD (Document Type Definition) della classe di documenti che si vuol marcare. Tuttavia la marcatura XML è attività che, se fatta manualmente, risulta lunga e dispendiosa, per di più l'ambiguità e l'indeterminatezza del linguaggio naturale fa si che i singoli documenti si distanzino spesso dal modello definito, aggravando ulteriormente il lavoro di marcatura. Questa peculiarità del linguaggio espone il metodo di marcatura ad altri due pericoli: 1.non riuscire a cogliere tale ambiguità ed indeterminatezza, 2.piegare il significato testuale all'esigenza di utilizzo di tale marcatura. Per tentare di ovviare a questi problemi si può agire in una duplice direzione: sviluppare strumenti di Natural Language Processing (NLP) che consentano il riconoscimento del testo e la sua marcatura automatica anche se le strutture testuali si distanziano dal modello. Tale marcatura infatti, difficilmente ottenibile dal redattore dei testi, in quanto estranea ai compiti e alle finalità della sua attività, se attuata da altri operatori con interventi successivi provoca (ed in alcuni casi ha già provocato) una dilatazione, spesso insostenibile, nei tempi e costi; stabilire degli standard linguistico documentari (regole di scrittura dei documenti) che rendano più omogenee, coerenti e puntuali le strutture dei documenti e quindi consentano alla macchina di riconoscere più agevolmente le strutture standardizzate.
2006
Istituto di Teoria e Tecniche dell'Informazione Giuridica - ITTIG - Sede Firenze
Istituto di Informatica Giuridica e Sistemi Giudiziari - IGSG
8849512872
Trattamento
automatico
linguaggio
normativo
amministrativo
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/89079
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact