Detail projektu
Speech enhancement front-end for robust automatic speech recognition with large amount of training data
Období řešení: 1.1.2021 — 31.12.2021
Zdroje financování
Neveřejný sektor - Přímé kontrakty - smluvní výzkum, neveřejné zdroje
O projektu
The purpose of the Joint Research is to develop Speech enhancement front-end for robust automatic speech recognition with large amount of training data through the cooperation of NTT and BUT. The work is relying on embeddings produced by neural networks in various places of the processing chain.
Popis česky
Cílem společného výzkumu je vyvinout technologie parametrizace s obohacováním
řeči pro robustní automatické rozpoznávání řeči s velkým objemem trénovacích dat
v rámci spolupráce mezi VUT a NTT. Práce je založena na nízkodimenzionálních
reprezentacích dat (embeddings) produkovaných neuronovými sítěmi v různých
místech řetězce zpracování.
Klíčová slova
speech recognition, robustness, large data, DNN embeddings
Klíčová slova česky
rozpoznávání řeči, odolnost, velký objem dat,
Originální jazyk
angličtina
Řešitelé
Žmolíková Kateřina, Ing., Ph.D. - hlavní řešitel
Kocour Martin, Ing. - spoluřešitel
Švec Ján, Ing. - spoluřešitel
Útvary
Ústav počítačové grafiky a multimédií
- odpovědné pracoviště (2.12.2020 - nezadáno)
Výzkumná skupina dolování dat z řeči BUT Speech@FIT
- interní (2.12.2020 - 31.12.2021)
NTT Corporation
- objednatel (2.12.2020 - 31.12.2021)
Ústav počítačové grafiky a multimédií
- příjemce (2.12.2020 - 31.12.2021)
Odpovědnost: Žmolíková Kateřina, Ing., Ph.D.