Product detail
SW3 ASR pro akusticky náročná prostředí
ŠMÍDL, L. KARAFIÁT, M. ŠVEC, J. LEHEČKA, J. MOŠNER, L. BRUKNER, J.
Product type
software
Abstract
Systém pro rozpoznávání řeči (ASR) asijského jazyka založený na moderních přístupech pro trénování. WAV2VEC model byl natrénován na obecných nahrávkách a dotrénován na vietnamských nahrávkách, které byly dále rozšířeny o množení (augmentace) dat pro náročné akustické podmínky. Tímto bylo dosaženo žádané robustnosti. Součástí výsledku je model na odstranění šumu z nahrávky. Výsledkem je aplikace využívající "Docker" kontejner a spustitelná z příkazové řádky (command line) na standardní distribuci Linuxu nebo Windows.
Keywords
ASR; rozpoznávání řeči; docker
Create date
20. 9. 2023
Location
Pro stažení kontaktujte: https://www.fit.vut.cz/person/karafiat/ nebo http://www.kky.zcu.cz/en/people/smidl-lubos
Possibilities of use
Výsledek je využíván vlastníkem
Licence fee
Poskytovatel licence na výsledek nepožaduje licenční poplatek
www