CoLFIS es una base de datos de la lengua italiana escrita de 3.798.275 palabras, formada de textos escritos de varios géneros analizados oportunamente y seleccionados en tres sectores distintos: diarios, periódicos y libros. El corpus realizado representa el italiano comúnmente leído, y no tanto la lengua italiana escrita en su totalidad. Esta elección se justifica en cuanto se deseaba construir un corpus, y en consecuencia un léxico de frecuencia, que se acercara lo más posible al léxico mental de un hablante de cultura media y no a un diccionario de la lengua italiana. El corpus CoLFIS ha sido sometido a una lematización completa y además se han desarrollado paquetes de software de análisis estadístico para producir los léxicos de frecuencia relativos al corpus total y a los distintos sectores. Este artículo analiza los componentes gramaticales de los diferentes textos del corpus lematizado CoLFIS; los objetivos son identificar las posibles diferencias de las partes del discurso en los textos de los diferentes sectores y subsectores que componen el corpus CoLFIS y, al mismo tiempo, tratar de establecer, para los diversos tipos de textos, dentro de qué gama de valores se coloca la relación entre sustantivos y verbos.

CoLFIS: análisis de las categorias morfosintácticas

P Cutugno;D Chiarella;R Lucentini;L Marconi;G Morgavi
2017

Abstract

CoLFIS es una base de datos de la lengua italiana escrita de 3.798.275 palabras, formada de textos escritos de varios géneros analizados oportunamente y seleccionados en tres sectores distintos: diarios, periódicos y libros. El corpus realizado representa el italiano comúnmente leído, y no tanto la lengua italiana escrita en su totalidad. Esta elección se justifica en cuanto se deseaba construir un corpus, y en consecuencia un léxico de frecuencia, que se acercara lo más posible al léxico mental de un hablante de cultura media y no a un diccionario de la lengua italiana. El corpus CoLFIS ha sido sometido a una lematización completa y además se han desarrollado paquetes de software de análisis estadístico para producir los léxicos de frecuencia relativos al corpus total y a los distintos sectores. Este artículo analiza los componentes gramaticales de los diferentes textos del corpus lematizado CoLFIS; los objetivos son identificar las posibles diferencias de las partes del discurso en los textos de los diferentes sectores y subsectores que componen el corpus CoLFIS y, al mismo tiempo, tratar de establecer, para los diversos tipos de textos, dentro de qué gama de valores se coloca la relación entre sustantivos y verbos.
Campo DC Valore Lingua
dc.authority.people P Cutugno it
dc.authority.people D Chiarella it
dc.authority.people R Lucentini it
dc.authority.people L Marconi it
dc.authority.people G Morgavi it
dc.collection.id.s 71c7200a-7c5f-4e83-8d57-d3d2ba88f40d *
dc.collection.name 04.01 Contributo in Atti di convegno *
dc.contributor.appartenenza Istituto di Elettronica e di Ingegneria dell'Informazione e delle Telecomunicazioni - IEIIT *
dc.contributor.appartenenza Istituto di linguistica computazionale "Antonio Zampolli" - ILC *
dc.contributor.appartenenza.mi 877 *
dc.contributor.appartenenza.mi 918 *
dc.date.accessioned 2024/02/19 14:36:08 -
dc.date.available 2024/02/19 14:36:08 -
dc.date.issued 2017 -
dc.description.abstract CoLFIS es una base de datos de la lengua italiana escrita de 3.798.275 palabras, formada de textos escritos de varios géneros analizados oportunamente y seleccionados en tres sectores distintos: diarios, periódicos y libros. El corpus realizado representa el italiano comúnmente leído, y no tanto la lengua italiana escrita en su totalidad. Esta elección se justifica en cuanto se deseaba construir un corpus, y en consecuencia un léxico de frecuencia, que se acercara lo más posible al léxico mental de un hablante de cultura media y no a un diccionario de la lengua italiana. El corpus CoLFIS ha sido sometido a una lematización completa y además se han desarrollado paquetes de software de análisis estadístico para producir los léxicos de frecuencia relativos al corpus total y a los distintos sectores. Este artículo analiza los componentes gramaticales de los diferentes textos del corpus lematizado CoLFIS; los objetivos son identificar las posibles diferencias de las partes del discurso en los textos de los diferentes sectores y subsectores que componen el corpus CoLFIS y, al mismo tiempo, tratar de establecer, para los diversos tipos de textos, dentro de qué gama de valores se coloca la relación entre sustantivos y verbos. -
dc.description.affiliations CNR-ILC, CNR-ISSIA, CNR-ILC, CNR-ILC, CNR-IEIIT -
dc.description.allpeople Cutugno, P; Chiarella, D; Lucentini, R; Marconi, L; Morgavi, G -
dc.description.allpeopleoriginal P. Cutugno, D. Chiarella, R. Lucentini, L. Marconi, G. Morgavi -
dc.description.fulltext none en
dc.description.numberofauthors 5 -
dc.identifier.isbn 9789597174325 -
dc.identifier.uri https://hdl.handle.net/20.500.14243/328766 -
dc.language.iso spa -
dc.publisher.country CUB -
dc.publisher.name Centro de Lingüística Aplicada, Ministero de Ciencia, Tecnología y Medio Ambiente -
dc.publisher.place Santiago de Cuba -
dc.relation.conferencedate 23-27/01/2017 -
dc.relation.conferencename XV° Simposio Internacional de Comunicación Social, Eloína Miyares in memoriam -
dc.relation.conferenceplace Santiago de Cuba -
dc.relation.numberofpages 9 -
dc.subject.keywords CoLFIS -
dc.subject.keywords corpus testuale -
dc.subject.keywords corpus sincronico -
dc.subject.keywords lingua italiana -
dc.subject.singlekeyword CoLFIS *
dc.subject.singlekeyword corpus testuale *
dc.subject.singlekeyword corpus sincronico *
dc.subject.singlekeyword lingua italiana *
dc.title CoLFIS: análisis de las categorias morfosintácticas en
dc.type.driver info:eu-repo/semantics/conferenceObject -
dc.type.full 04 Contributo in convegno::04.01 Contributo in Atti di convegno it
dc.type.miur 273 -
dc.type.referee Sì, ma tipo non specificato -
dc.ugov.descaux1 370904 -
iris.orcid.lastModifiedDate 2024/04/04 12:52:06 *
iris.orcid.lastModifiedMillisecond 1712227926187 *
iris.sitodocente.maxattempts 2 -
Appare nelle tipologie: 04.01 Contributo in Atti di convegno
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/328766
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact