Parallel texts can represent an extremely useful source of information in a number of text and linguistic processing tasks. In this work we show an experiment conducted on the Italian translation of the Babylonian Talmud, a text we have analyzed and processed to support in the construction of a multilingual Hebrew/Aramaic/Italian terminological resource. The approach we adopted comprised: i) the TEI encoding of the text, ii) the automatic extraction of the Italian terms, iii) the addition of Hebrew/Aramaic terms via word-by-word alignment, iv) the revision of the obtained results.
I testi paralleli possono costituire una fonte estremamente utile di informazioni per numerosi task di elaborazione del testo e della lingua. In questo lavoro illustriamo un esperimento condotto sulla traduzione italiana del Talmud babilonese, un testo che abbiamo analizzato ed elaborato per supportare la costruzione di una risorsa terminologica multilingue in Ebraico, Aramaico e Italiano. L'approccio adottato comprende: i) la codifica TEI del testo, ii) l'estrazione automatica dei termini italiani, iii) l'aggiunta dei termini ebraici e aramaici tramite tecniche di allineamento parola per parola, iv) la revisione dei risultati ottenuti.
Enriching a Multilingual Terminology Exploiting Parallel Texts: An Experiment on the Italian Translation of the Babylonian Talmud
Angelo Mario Del Grosso;Emiliano Giovannetti;Simone Marchi
2020
Abstract
Parallel texts can represent an extremely useful source of information in a number of text and linguistic processing tasks. In this work we show an experiment conducted on the Italian translation of the Babylonian Talmud, a text we have analyzed and processed to support in the construction of a multilingual Hebrew/Aramaic/Italian terminological resource. The approach we adopted comprised: i) the TEI encoding of the text, ii) the automatic extraction of the Italian terms, iii) the addition of Hebrew/Aramaic terms via word-by-word alignment, iv) the revision of the obtained results.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.