Dans cette contribution, nous présentons une étude sur la stylistique computationnelle des textes de la littérature classiques française fondée sur une approche conduite par données, où la découverte des motifs linguistiques intéressants se fait sans aucune connaissance préalable. Nous proposons une mesure objective capable de capturer et d'extraire des motifs syntaxiques stylistiques significatifs à partir d'un oeuvre d'un auteur donné. Notre hypothèse de travail est fondée sur le fait que les motifs syntaxiques les plus pertinents devraient refléter de manière significative le choix stylistique de l'auteur, et donc ils doivent présenter une sorte de comportement de surreprésentation contrôlé par les objectifs de l'auteur. Les résultats analysés montrent l'efficacité dans l'extraction de motifs syntaxiques intéressants dans le texte littéraire français classique, et semblent particulièrement prometteurs pour les analyses de ce type particulier de texte.
In this contribution, we present a computational stylistic study of the French classic literature texts based on a data-driven approach where discovering interesting linguistic patterns is done without any prior knowledge. We propose an objective measure capable of capturing and extracting meaningful stylistic syntactic patterns from a given author's work. Our hypothesis is based on the fact that the most relevant syntactic patterns should significantly reflect the author's stylistic choice and thus they should exhibit some kind of overrepresentation behavior controlled by the author's purpose. The analysed results show the effectiveness in extracting interesting syntactic patterns from classic French literary text, and seem particularly promising for the analyses of such particular text.
Une mesure d'intérêt à base de surreprésentation pour l'extraction des motifs syntaxiques stylistiques
Francesca Frontini;
2015
Abstract
In this contribution, we present a computational stylistic study of the French classic literature texts based on a data-driven approach where discovering interesting linguistic patterns is done without any prior knowledge. We propose an objective measure capable of capturing and extracting meaningful stylistic syntactic patterns from a given author's work. Our hypothesis is based on the fact that the most relevant syntactic patterns should significantly reflect the author's stylistic choice and thus they should exhibit some kind of overrepresentation behavior controlled by the author's purpose. The analysed results show the effectiveness in extracting interesting syntactic patterns from classic French literary text, and seem particularly promising for the analyses of such particular text.| Campo DC | Valore | Lingua |
|---|---|---|
| dc.authority.orgunit | Istituto di linguistica computazionale "Antonio Zampolli" - ILC | - |
| dc.authority.people | MohamedAmine Boukhaled | it |
| dc.authority.people | Francesca Frontini | it |
| dc.authority.people | JeanGabriel Ganascia | it |
| dc.collection.id.s | 71c7200a-7c5f-4e83-8d57-d3d2ba88f40d | * |
| dc.collection.name | 04.01 Contributo in Atti di convegno | * |
| dc.contributor.appartenenza | Istituto di linguistica computazionale "Antonio Zampolli" - ILC | * |
| dc.contributor.appartenenza.mi | 918 | * |
| dc.date.accessioned | 2024/02/20 12:00:59 | - |
| dc.date.available | 2024/02/20 12:00:59 | - |
| dc.date.issued | 2015 | - |
| dc.description.abstract | Dans cette contribution, nous présentons une étude sur la stylistique computationnelle des textes de la littérature classiques française fondée sur une approche conduite par données, où la découverte des motifs linguistiques intéressants se fait sans aucune connaissance préalable. Nous proposons une mesure objective capable de capturer et d'extraire des motifs syntaxiques stylistiques significatifs à partir d'un oeuvre d'un auteur donné. Notre hypothèse de travail est fondée sur le fait que les motifs syntaxiques les plus pertinents devraient refléter de manière significative le choix stylistique de l'auteur, et donc ils doivent présenter une sorte de comportement de surreprésentation contrôlé par les objectifs de l'auteur. Les résultats analysés montrent l'efficacité dans l'extraction de motifs syntaxiques intéressants dans le texte littéraire français classique, et semblent particulièrement prometteurs pour les analyses de ce type particulier de texte. | - |
| dc.description.abstracteng | In this contribution, we present a computational stylistic study of the French classic literature texts based on a data-driven approach where discovering interesting linguistic patterns is done without any prior knowledge. We propose an objective measure capable of capturing and extracting meaningful stylistic syntactic patterns from a given author's work. Our hypothesis is based on the fact that the most relevant syntactic patterns should significantly reflect the author's stylistic choice and thus they should exhibit some kind of overrepresentation behavior controlled by the author's purpose. The analysed results show the effectiveness in extracting interesting syntactic patterns from classic French literary text, and seem particularly promising for the analyses of such particular text. | - |
| dc.description.affiliations | LIP6 (Laboratoire d'Informatique de Paris 6), Université Pierre et Marie Curie and CNRS (UMR7606), ACASA Team, 4, place Jussieu, 75252-PARIS Cedex 05 (France) | - |
| dc.description.allpeople | Boukhaled, Mohamedamine; Frontini, Francesca; Ganascia, Jeangabriel | - |
| dc.description.allpeopleoriginal | Mohamed-Amine Boukhaled, Francesca Frontini, Jean-Gabriel Ganascia | - |
| dc.description.fulltext | none | en |
| dc.description.numberofauthors | 3 | - |
| dc.identifier.uri | https://hdl.handle.net/20.500.14243/294757 | - |
| dc.identifier.url | http://www.atala.org/taln_archives/TALN/TALN-2015/taln-2015-court-012.html | - |
| dc.language.iso | fre | - |
| dc.relation.conferencedate | 22-25/06/2015 | - |
| dc.relation.conferencename | 22e Conférence Sur Le Traitement Automatique Des Langues Naturelles (TALN 2015) | - |
| dc.relation.conferenceplace | Caen, France | - |
| dc.relation.firstpage | 391 | - |
| dc.relation.ispartofbook | Actes de La 22e Conférence Sur Le Traitement Automatique Des Langues Naturelles | - |
| dc.relation.lastpage | 396 | - |
| dc.relation.numberofpages | 6 | - |
| dc.subject.keywords | Computational stylistic | - |
| dc.subject.keywords | text mining | - |
| dc.subject.keywords | syntactic patterns | - |
| dc.subject.keywords | interestingness measure | - |
| dc.subject.singlekeyword | Computational stylistic | * |
| dc.subject.singlekeyword | text mining | * |
| dc.subject.singlekeyword | syntactic patterns | * |
| dc.subject.singlekeyword | interestingness measure | * |
| dc.title | Une mesure d'intérêt à base de surreprésentation pour l'extraction des motifs syntaxiques stylistiques | en |
| dc.type.driver | info:eu-repo/semantics/conferenceObject | - |
| dc.type.full | 04 Contributo in convegno::04.01 Contributo in Atti di convegno | it |
| dc.type.miur | 273 | - |
| dc.type.referee | Sì, ma tipo non specificato | - |
| dc.ugov.descaux1 | 333078 | - |
| iris.orcid.lastModifiedDate | 2024/04/04 11:04:20 | * |
| iris.orcid.lastModifiedMillisecond | 1712221460231 | * |
| iris.sitodocente.maxattempts | 1 | - |
| Appare nelle tipologie: | 04.01 Contributo in Atti di convegno | |
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.


