Product detail

Český stemmer v jazyce Snowball

HELLEBRAND, D. CHMELAŘ, P.

Product type

software

Abstract

Produktem je stematizační algoritmus pro český jazyk založený na gramatických pravidlech jako doplněk k metodám používajícím slovník pro vyhledávání a dolování českého textu. Snowball implementace stematizačního algoritmu českého jazyka je vytvořena na základě kompletní sady všech předpon, přípon a koncovek, které se mohou v českém jazyce vyskytovat. Dokumentace jazyka Snowball na adrese snowball.tartarus.org (http://snowball.tartarus.org/) a text diplomové práce www.fit.vutbr.cz/study/DP/rpfile.php?id=7988 (http://www.fit.vutbr.cz/study/DP/rpfile.php?id=7988) (v češtině). Publikace vztahující se k tomuto produktu je uvedena na www.fit.vutbr.cz/research/view_pub.php?id=9473 (http://www.fit.vutbr.cz/research/view_pub.php?id=9473).

Keywords

Lemmatizace, stematizace, Snowball, český jazyk, gramatika.

Create date

25. 6. 2010

Location

http://www.fit.vutbr.cz/research/view_product.php?id=133

Possibilities of use

K využití výsledku jiným subjektem je vždy nutné nabytí licence

Licence fee

Poskytovatel licence na výsledek nepožaduje licenční poplatek

www

Documents