Detail produktu

SW3 ASR pro akusticky náročná prostředí

ŠMÍDL, L. KARAFIÁT, M. ŠVEC, J. LEHEČKA, J. MOŠNER, L. BRUKNER, J.

Typ produktu

software

Abstrakt

Systém pro rozpoznávání řeči (ASR) asijského jazyka založený na moderních přístupech pro trénování. WAV2VEC model byl natrénován na obecných nahrávkách a dotrénován na vietnamských nahrávkách, které byly dále rozšířeny o množení (augmentace) dat pro náročné akustické podmínky. Tímto bylo dosaženo žádané robustnosti. Součástí výsledku je model na odstranění šumu z nahrávky. Výsledkem je aplikace využívající "Docker" kontejner a spustitelná z příkazové řádky (command line) na standardní distribuci Linuxu nebo Windows.

Klíčová slova

ASR; rozpoznávání řeči; docker

Datum vzniku

20. 9. 2023

Umístění

Pro stažení kontaktujte: https://www.fit.vut.cz/person/karafiat/ nebo http://www.kky.zcu.cz/en/people/smidl-lubos

Možnosti využití

Výsledek je využíván vlastníkem

Licenční poplatek

Poskytovatel licence na výsledek nepožaduje licenční poplatek

www