Detail produktu
SW3 ASR pro akusticky náročná prostředí
ŠMÍDL, L. KARAFIÁT, M. ŠVEC, J. LEHEČKA, J. MOŠNER, L. BRUKNER, J.
Typ produktu
software
Abstrakt
Systém pro rozpoznávání řeči (ASR) asijského jazyka založený na moderních přístupech pro trénování. WAV2VEC model byl natrénován na obecných nahrávkách a dotrénován na vietnamských nahrávkách, které byly dále rozšířeny o množení (augmentace) dat pro náročné akustické podmínky. Tímto bylo dosaženo žádané robustnosti. Součástí výsledku je model na odstranění šumu z nahrávky. Výsledkem je aplikace využívající "Docker" kontejner a spustitelná z příkazové řádky (command line) na standardní distribuci Linuxu nebo Windows.
Klíčová slova
ASR; rozpoznávání řeči; docker
Datum vzniku
20. 9. 2023
Umístění
Pro stažení kontaktujte: https://www.fit.vut.cz/person/karafiat/ nebo http://www.kky.zcu.cz/en/people/smidl-lubos
Možnosti využití
Výsledek je využíván vlastníkem
Licenční poplatek
Poskytovatel licence na výsledek nepožaduje licenční poplatek
www