Product detail

Software pro extrakci informace z polostrukturovaných dokumentů

HRADIŠ, M. KIŠŠ, M. KOHÚT, J. BENEŠ, K. KOSTELNÍK, M.

Product type

software

Abstract

Tento software poskytuje komplexní nástroje pro extrakci informací z polostrukturovaných dokumentů. Tento software také poskytuje uživateli možnost trénovat vlastní model na datech podle vlastního přání. To zahrnuje několik dalších kroků, protože proces zahrnuje automatickou přípravu trénovacích dat pro model extrakce. Software je navržen pro použití jako aplikace příkazového řádku, ale je otevřený pro rozšíření o podporu dalších vstupních a výstupních formátů.

Keywords

Extrakce informací, polostrukturované dokumenty, OCR

Create date

28. 12. 2022

Location

https://github.com/DCGM/pero-indexer, pip https://pypi.org/project/pero-indexer/

Possibilities of use

K využití výsledku jiným subjektem je vždy nutné nabytí licence

Licence fee

Poskytovatel licence na výsledek nepožaduje licenční poplatek

www

Documents