RecBoost è un sistema per la segmentazione di stringhe testuali che utilizza il meccanismo della “classificazione progressiva”, sviluppato in seno all’ICAR-CNR. L’idea di base è quella di costruire incrementalmente un insieme di regole di classificazione che permettano di associare ad ogni token presente nella stringa un campo dello schema di interesse. Il sistema permette, partendo da un file di testo contenente stringhe, di segmentare ogni stringa in accordo ad uno schema tabellare fornito anch’esso in input. Il sistema è implementato in Java e si interfaccia a Database MS SQL.

Il sistema RecBoost per la Segmentazione del Testo

Giuseppe Manco;Riccardo Ortale
2006

Abstract

RecBoost è un sistema per la segmentazione di stringhe testuali che utilizza il meccanismo della “classificazione progressiva”, sviluppato in seno all’ICAR-CNR. L’idea di base è quella di costruire incrementalmente un insieme di regole di classificazione che permettano di associare ad ogni token presente nella stringa un campo dello schema di interesse. Il sistema permette, partendo da un file di testo contenente stringhe, di segmentare ogni stringa in accordo ad uno schema tabellare fornito anch’esso in input. Il sistema è implementato in Java e si interfaccia a Database MS SQL.
2006
Istituto di Calcolo e Reti ad Alte Prestazioni - ICAR
Text segmentation
classification
rule learning
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/194618
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact