Project detail

semANT - Semantic Document Exploration

Duration: 01.03.2023 — 31.12.2027

Funding resources

Ministerstvo kultury ČR - NAKI III – program na podporu aplikovaného výzkumu v oblasti národní a kulturní identity na léta 2023 až 2030

- whole funder (2023-03-01 - 2027-12-31)

On the project

Hlavním cílem tohoto projektu je proto zlepšit možnosti vyhledávání ve fulltextové reprezentaci digitalizovaných dokumentů na úrovni významu textu a možnosti přirozené navigace mezi tématicky podobnými dokumenty. Uživatelům poskytneme fulltextové vyhledávání rozšířené o pochopení významu dotazů, možnost vyhledávat podle částí textu (například odstavců) s možností specifikovat současně téma, které ho v daném textu zajímá. Systém bude pracovat s automaticky identifikovanými tématy, ale umožní uživatelům definovat vlastní témata na základě příkladů z textů. 

Description in English
The main goal of this project is therefore to improve the possibilities of searching in the full-text representation of digitized documents at the level of text meaning and the possibilities of natural navigation between thematically similar documents. We provide users with a full-text search extended by understanding the meaning of queries, the ability to search by parts of the text (such as paragraphs) with the ability to specify at the same time the topic that interests him in the text. The system will work with automatically identified topics, but will allow users to define their own topics based on examples from texts.

Keywords
digitální knihovna, identifikace tématu, vyhledávání sémantických dokumentů, průzkum obsahu, vizualizace obsahu

Key words in English
digital library, topic identification, semantic document search, content exploration, content visualization

Mark

DH23P03OVV060

Default language

Czech

People responsible

Beneš Karel, Ing. - fellow researcher
Dočekal Martin, Ing. - fellow researcher
Fajčík Martin, Ing., Ph.D. - fellow researcher
Kavalová Radka, Mgr. - fellow researcher
Kišš Martin, Ing. - fellow researcher
Kohút Jan, Ing. - fellow researcher
Lampa Petr, Ing. - fellow researcher
Smrž Pavel, doc. RNDr., Ph.D. - fellow researcher
Hradiš Michal, Ing., Ph.D. - principal person responsible

Units

Department of Computer Graphics and Multimedia
- beneficiary (2022-04-19 - 2027-12-31)

Results

KOSTELNÍK, M.; BENEŠ, K.; HRADIŠ, M.; VAŠKO, M.: semAnt-TextBite; Systém pro analýzu struktury dokumentů. https://github.com/DCGM/semANT-TextBite, pip https://pypi.org/project/textbite/. URL: https://www.fit.vut.cz/research/product/811/. (software)
Detail