Detail předmětu
Zpracování řeči
FEKT-LZPRAk. rok: 2011/2012
Kurz podává ucelený pohled na současné řešení podstatných problémů,které se v systémech řečové komunikace objevují. Kurz je určen studentům, kteří chtějí porozumět a osvojit základní i pokročilé techniky zpracování, syntézy a rozpoznávání mluvené řeči.
Jazyk výuky
čeština
Počet kreditů
6
Garant předmětu
Zajišťuje ústav
Výsledky učení předmětu
Student získá přehled o modelu vytváření řeči, analýze řečových signálů a o klasických příznacích řečového signálu. Studenti se dále seznámí s predikční analýzou, spektrogramem a homomorfní analýzou užitou pro techniky automatického rozpoznání povelů.
Studenti se seznámí mimo klasických metod se základními principy techniky ověřování mluvčího, s problematikou separace řeči od hlučného akustického pozadí a také s nejnovšími trendy z oblasti automatické rozpoznání řeči.
Studenti se seznámí mimo klasických metod se základními principy techniky ověřování mluvčího, s problematikou separace řeči od hlučného akustického pozadí a také s nejnovšími trendy z oblasti automatické rozpoznání řeči.
Prerekvizity
Jsou požadovány znalosti na úrovni bakalářského studia.
Plánované vzdělávací činnosti a výukové metody
Metody vyučování závisejí na způsobu výuky a jsou popsány článkem 7 Studijního a zkušebního řádu VUT.
Způsob a kritéria hodnocení
Podmínky pro úspěšné ukončení předmětu stanoví každoročně aktualizovaná vyhláška garanta předmětu.
Učební cíle
Cílem je poskytnout ucelený pohled na systémy řečové komunikace. Je určen studentům, kteří si chtějí osvojit základní a pokročilé techniky zpracování, syntézy a rozpoznávání mluvené řeči. Mimo základních principů ověřování mluvčího se studenti seznámí s problematikou separace řeči z hlučného pozadí a principy automatického rozpoznávání řeči.
Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky
Vymezení kontrolované výuky a způsob jejího provádění stanoví každoročně aktualizovaná vyhláška garanta předmětu.
Základní literatura
UHLÍŘ, J. SOVKA, P.: Digital Signal Processing (Číslicové zpracování signálů), ČVUT, Praha, 1995. (In Czech)
Zařazení předmětu ve studijních plánech
Typ (způsob) výuky
Přednáška
26 hod., nepovinná
Vyučující / Lektor
Osnova
Charakter a informační obsah řečového signálu.
Fonetický popis českého jazyka.
Úvod do analýzy řečových signálů, model vytváření řeči.
Používané příznaky při analýze řečového signálu
Rozbor homomorfní analýzy (LPCC, LFCC a MFCC koeficienty).
Automatické rozpoznávání povelů.
Automatické rozpoznávání mluvčího.
Časová a kmitočtová syntéza řeči.
Techniky kódování řeči.
Řečový signál a rušení.
Jednokanálové filtrační techniky.
Vícekanálové filtrační techniky.
Technické prostředky pro realizaci.
Fonetický popis českého jazyka.
Úvod do analýzy řečových signálů, model vytváření řeči.
Používané příznaky při analýze řečového signálu
Rozbor homomorfní analýzy (LPCC, LFCC a MFCC koeficienty).
Automatické rozpoznávání povelů.
Automatické rozpoznávání mluvčího.
Časová a kmitočtová syntéza řeči.
Techniky kódování řeči.
Řečový signál a rušení.
Jednokanálové filtrační techniky.
Vícekanálové filtrační techniky.
Technické prostředky pro realizaci.
Laboratorní cvičení
39 hod., povinná
Vyučující / Lektor
Osnova
Modifikace wav-souboru v prostředí Matlabu
Výpočet autokorelačních a LPC koeficientů
Analýza řečových signálů pomocí spektrogramu
Výpočet kepstrálních koeficientů (LPCC, LFCC a MFCC koeficienty)
Výpočet AMDF funkce, určování základního tónu
Výběr příznaků pro automatické rozpoznání povelů
Výběr příznaků pro automatické rozpoznání mluvčího
Určování hranic promluvy v zašumělých nahrávkách
Syntéza řeči v časové oblasti
Zadání individuálních projektů
Řešení a konzultace individuálních projektů
Řešení a konzultace individuálních projektů
Odevzdání individuálních projektů a udělení zápočtu
Výpočet autokorelačních a LPC koeficientů
Analýza řečových signálů pomocí spektrogramu
Výpočet kepstrálních koeficientů (LPCC, LFCC a MFCC koeficienty)
Výpočet AMDF funkce, určování základního tónu
Výběr příznaků pro automatické rozpoznání povelů
Výběr příznaků pro automatické rozpoznání mluvčího
Určování hranic promluvy v zašumělých nahrávkách
Syntéza řeči v časové oblasti
Zadání individuálních projektů
Řešení a konzultace individuálních projektů
Řešení a konzultace individuálních projektů
Odevzdání individuálních projektů a udělení zápočtu