RecBoost è un sistema per la segmentazione di stringhe testuali che utilizza il meccanismo della classificazione progressiva, sviluppato in seno allICAR-CNR. Lidea di base è quella di costruire incrementalmente un insieme di regole di classificazione che permettano di associare ad ogni token presente nella stringa un campo dello schema di interesse. Il sistema permette, partendo da un file di testo contenente stringhe, di segmentare ogni stringa in accordo ad uno schema tabellare fornito anchesso in input. Il sistema è implementato in Java e si interfaccia a Database MS SQL.
Il sistema RecBoost per la Segmentazione del Testo
Giuseppe Manco;Riccardo Ortale
2006
Abstract
RecBoost è un sistema per la segmentazione di stringhe testuali che utilizza il meccanismo della classificazione progressiva, sviluppato in seno allICAR-CNR. Lidea di base è quella di costruire incrementalmente un insieme di regole di classificazione che permettano di associare ad ogni token presente nella stringa un campo dello schema di interesse. Il sistema permette, partendo da un file di testo contenente stringhe, di segmentare ogni stringa in accordo ad uno schema tabellare fornito anchesso in input. Il sistema è implementato in Java e si interfaccia a Database MS SQL.File in questo prodotto:
Non ci sono file associati a questo prodotto.
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.