PAIS`A is a Creative Commons licensed, large web corpus of contemporary Italian. We describe the design, harvesting, and processing steps involved in its creation.

The PAISÀ Corpus of Italian Web Texts

Felice Dell'Orletta;Vito Pirrelli
2014

Abstract

PAIS`A is a Creative Commons licensed, large web corpus of contemporary Italian. We describe the design, harvesting, and processing steps involved in its creation.
2014
Istituto di linguistica computazionale "Antonio Zampolli" - ILC
Inglese
Felix Bildhauer, Roland Schäfer
Proceedings of the 9th Web as Corpus Workshop (WaC-9)
Corpus annotation, Tree-bank, Corpus design, Corpus harvesting
36
43
8
http://aclweb.org/anthology/W14-04
Association for Computational Linguistics
Stroudsburg
STATI UNITI D'AMERICA
Sì, ma tipo non specificato
April 26, 2014
Gothenburg. Sweden
9
none
Lyding, Verena; Stemle, Egon; Borghetti, Claudia; Brunello, Marco; Castagnoli, Sara; Dell'Orletta, Felice; Dittmann, Henrik; Lenci, Alessandro; Pirrel...espandi
273
info:eu-repo/semantics/conferenceObject
04 Contributo in convegno::04.01 Contributo in Atti di convegno
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/261825
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact