Detail produktu

Text Preprocessing Tool

ŠABATKA, O. BARTÍK, V.

Typ produktu

software

Abstrakt

The tool enables text preprocessing of documents for text mining. It offers several possibilities of document representation (words or N-grams as terms) and several weighting methods (binary, TF or TF-IDF). It also provides two standard pre-processing procedures of text - stopwords removal and stemming.

Klíčová slova

text mining, preprocessing, document representation, N-grams,  TF-IDF

Datum vzniku

10. 11. 2010

Umístění

http://www.fit.vutbr.cz/~bartik/Arcbc/download.htm

Možnosti využití

Využití výsledku jiným subjektem je v některých případech možné bez nabytí licence

Licenční poplatek

Poskytovatel licence na výsledek nepožaduje licenční poplatek

www