Project detail

Making Software FAIR: Identifying and Extracting Software Mentions from Open Research Papers and Registering them with PIDs

Duration: 1.1.2024 — 31.12.2025

Funding resources

Technologická agentura ČR - CHRIST-ERA Call Open Research Data

- part funder (1. 1. 2024 - 31. 12. 2025)

On the project

Collaboration with partners to further develop existing ML-based bibliographic extraction tools, which are already state of the art, can significantly improve on current methodologies. By integrating and applying these new tools within established open scholarly infrastructures used by millions of people (CORE, EuropePMC, HAL, Software Heritage), we will increase metadata quality and facilitate the adoption of persistent identifiers across the open repositories network. This will make research software more discoverable within the open scholarly infrastructure in line with FAIR policies. The systematic archival in the Software Heritage universal archive of the corresponding source code, when available, will also make research software available and reusable.

Description in Czech
Spolupráce s partnery na dalším vývoji existujících nástrojů pro bibliografickou extrakci založených na ML, které jsou již nejmodernější, může výrazně zlepšit současné metodiky. Integrací a aplikací těchto nových nástrojů v rámci zavedených otevřených vědeckých infrastruktur používaných miliony lidí (CORE, EuropePMC, HAL, Software Heritage) zvýšíme kvalitu metadat a usnadníme přijetí trvalých identifikátorů v síti otevřených repozitářů. Díky tomu bude výzkumný software lépe zjistitelný v rámci otevřené vědecké infrastruktury v souladu se zásadami FAIR. Systematická archivace odpovídajícího zdrojového kódu v univerzálním archivu Software Heritage, bude-li k dispozici, rovněž zpřístupní a znovu použije výzkumný software.

open research data, FAIR, ML-based bibliographoc extraction tool

Key words in Czech
otevřený výzkum dat, FAIR, nástroj pro extrakci bibliografie založený na ML



Default language


People responsible

Smrž Pavel, doc. RNDr., Ph.D. - principal person responsible
Dočekal Martin, Ing. - fellow researcher
Dytrych Jaroslav, Ing., Ph.D. - fellow researcher
Fajčík Martin, Ing., Ph.D. - fellow researcher


Department of Computer Graphics and Multimedia
- responsible department (9.12.2022 - not assigned)
Department of Computer Graphics and Multimedia
- co-beneficiary (9.12.2022 - 31.12.2025)
Inria, Willow Computer vision and machine learning research laboratory
- co-beneficiary (9.12.2022 - 31.12.2025)
Polish Academy of Sciences
- co-beneficiary (9.12.2022 - 31.12.2025)
The Open University
- beneficiary (9.12.2022 - 31.12.2025)