Detail projektu
NTTC-Speech enhancement front-end for robust automatic speech recognition with large amount of training data
Období řešení: 1.2.2025 — 31.1.2026
Zdroje financování
Neveřejný sektor - Přímé kontrakty - smluvní výzkum, neveřejné zdroje
O projektu
The joint research will aim at investigating and developing speech enhancement and speaker diarization techniques for automatic speech recognition systems that are trained using a large amount of training data.
Popis česky
Společný výzkum se zaměří na zkoumání a vývoj technik vylepšování řeči
a diarizace mluvčího pro systémy automatického rozpoznávání řeči, které jsou
trénovány pomocí velkého množství tréninkových dat.
Klíčová slova
speech recognition, speaker diarization, large data, robustness
Originální jazyk
angličtina
Řešitelé
Burget Lukáš, doc. Ing., Ph.D. - hlavní řešitel
Klement Dominik, Bc. - spoluřešitel
Pálka Petr, Bc. - spoluřešitel
Pavlus Ján, Ing. - spoluřešitel
Útvary
Ústav počítačové grafiky a multimédií
- odpovědné pracoviště (15.1.2025 - nezadáno)
Výzkumná skupina dolování dat z řeči BUT Speech@FIT
- interní (15.1.2025 - 31.1.2026)
NTT Corporation
- objednatel (15.1.2025 - 31.1.2026)
Ústav počítačové grafiky a multimédií
- příjemce (15.1.2025 - 31.1.2026)
Odpovědnost: Burget Lukáš, doc. Ing., Ph.D.