Detail projektu

NTTC-Speech enhancement front-end for robust automatic speech recognition with large amount of training data

Období řešení: 1.2.2025 — 31.1.2026

Zdroje financování

Neveřejný sektor - Přímé kontrakty - smluvní výzkum, neveřejné zdroje

O projektu

The joint research will aim at investigating and developing speech enhancement and speaker diarization techniques for automatic speech recognition systems that are trained using a large amount of training data.

Popis česky
Společný výzkum se zaměří na zkoumání a vývoj technik vylepšování řeči a diarizace mluvčího pro systémy automatického rozpoznávání řeči, které jsou trénovány pomocí velkého množství tréninkových dat.

Klíčová slova
speech recognition, speaker diarization, large data, robustness

Originální jazyk

angličtina

Řešitelé

Burget Lukáš, doc. Ing., Ph.D. - hlavní řešitel
Klement Dominik, Bc. - spoluřešitel
Pálka Petr, Bc. - spoluřešitel
Pavlus Ján, Ing. - spoluřešitel

Útvary

Ústav počítačové grafiky a multimédií
- odpovědné pracoviště (15.1.2025 - nezadáno)
Výzkumná skupina dolování dat z řeči BUT Speech@FIT
- interní (15.1.2025 - 31.1.2026)
NTT Corporation
- objednatel (15.1.2025 - 31.1.2026)
Ústav počítačové grafiky a multimédií
- příjemce (15.1.2025 - 31.1.2026)

Odpovědnost: Burget Lukáš, doc. Ing., Ph.D.

VUT

Fakulty

Vysokoškolské ústavy

Součásti

NTTC-Speech enhancement front-end for robust automatic speech recognition with large amount of training data