Detail produktu

Software pro extrakci informace z polostrukturovaných dokumentů

HRADIŠ, M. KIŠŠ, M. KOHÚT, J. BENEŠ, K. KOSTELNÍK, M.

Typ produktu

software

Abstrakt

Tento software poskytuje komplexní nástroje pro extrakci informací z polostrukturovaných dokumentů. Tento software také poskytuje uživateli možnost trénovat vlastní model na datech podle vlastního přání. To zahrnuje několik dalších kroků, protože proces zahrnuje automatickou přípravu trénovacích dat pro model extrakce. Software je navržen pro použití jako aplikace příkazového řádku, ale je otevřený pro rozšíření o podporu dalších vstupních a výstupních formátů.

Klíčová slova

Extrakce informací, polostrukturované dokumenty, OCR

Datum vzniku

28. 12. 2022

Umístění

https://github.com/DCGM/pero-indexer, pip https://pypi.org/project/pero-indexer/

Možnosti využití

K využití výsledku jiným subjektem je vždy nutné nabytí licence

Licenční poplatek

Poskytovatel licence na výsledek nepožaduje licenční poplatek

www

Dokumenty