Detail předmětu

Analýza a syntéza řečových signálů

FEKT-LASSAk. rok: 2010/2011

Fonetický popis českého jazyka, váhování signálu, preemfáze, určení základního tónu řeči, parametrický popis řečového signálu v časové a kmitočtové oblasti, krátkodobá analýza řečového signálu, metody výběru vhodných příznaků, určení začátku a konce slov, lineární a nelineární časové transformace, systémy na rozpoznávání slov a slovních spojení, vhodné řečové jednotky a příznaky na rozpoznávání mluvčího, skryté Markovovy modely, identifikace a verifikace mluvčích, metody syntézy řeči, vokodéry, typické aplikace na rozpoznávání řeči a mluvčích.

Jazyk výuky

čeština

Počet kreditů

8

Výsledky učení předmětu

Studenti se seznámí s fonetickým popisem českého jazyka, parametry řečového signálu, metodami výběru vhodných řečových příznaků, systémy na rozpoznávání řeči a rozpoznávání mluvčích, metodami syntézy řeči, vokodéry pro přenos řeči, speciálními integrovanými obvody na zpracování řeči a různými aplikacemi.

Prerekvizity

Jsou požadovány znalosti na úrovni bakalářského studia.

Plánované vzdělávací činnosti a výukové metody

Metody vyučování závisejí na způsobu výuky a jsou popsány článkem 7 Studijního a zkušebního řádu VUT.

Způsob a kritéria hodnocení

Podmínky pro úspěšné ukončení předmětu stanoví každoročně aktualizovaná vyhláška garanta předmětu.

Osnovy výuky

Základní orientace, akustická teorie vytváření řeči.
Hlasový trakt, fonetický popis českého jazyka.
Předzpracování řečového signálu: váhování, preemfáze.
Energie, počet průchodů nulou, autokorelační koeficienty.
Lineární prediktivní kódování a odvozené koeficienty.
Cepstrální analýza řečového signálu.
Určování základního tónu řeči.
Lineární a nelineární časové transformace.
Deterministické a statistické klasifikátory, skryté Markovovy modely.
Učení klasifikátoru, měření úspěšnosti klasifikace.
Rozpoznávání hlasu, ověřování a identifikace mluvčích.
Metody syntézy řeči.
Základní způsoby přenosu řeči, hlavní typy vokodérů.

Učební cíle

Cílem předmětu je seznámit studenty se základními metodami pro automatické rozpoznávání vyslovených slov, postupy při verifikaci a identifikaci mluvčích na základě jejich hlasu a metodami syntézy řeči.

Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky

Vymezení kontrolované výuky a způsob jejího provádění stanoví každoročně aktualizovaná vyhláška garanta předmětu.

Základní literatura

PSUTKA,J. Komunikace s počítačem mluvenou řečí. Academia, Praha 1995.
SIGMUND,M. Analýza řečových signálů. Skriptum FEKT VUT, Brno 2000.

Doporučená literatura

RABINER,R., JUANG,B.H. Fundamentals of Speech Recognition. Prentice Hall, Englewood Cliffs, N.J., 1993.

Zařazení předmětu ve studijních plánech

  • Program EEKR-ML magisterský navazující

    obor ML-EST , 1 ročník, letní semestr, volitelný oborový

Typ (způsob) výuky

 

Přednáška

39 hod., nepovinná

Vyučující / Lektor

Osnova

01 Základní orientace, akustická teorie vytváření řeči.
02 Hlasový trakt, fonetický popis českého jazyka.
03 Předzpracování řečového signálu: váhování, preemfáze.
04 Energie, počet průchodů nulou, autokorelační koeficienty.
05 Lineární prediktivní kódování a odvozené koeficienty.
06 Cepstrální analýza řečového signálu.
07 Určování základního tónu řeči.
08 Lineární a nelineární časové transformace.
09 Deterministické a statistické klasifikátory, skryté Markovovy modely.
10 Učení klasifikátoru, měření úspěšnosti klasifikace.
11 Rozpoznávání hlasu, ověřování a identifikace mluvčích.
12 Metody syntézy řeči.
13 Základní způsoby přenosu řeči, hlavní typy vokodérů.

Cvičení na počítači

52 hod., povinná

Vyučující / Lektor

Osnova

Časový průběh řeči, vyhledávání jednotlivých fonémů.
Spektra samohlásek, formantové kmitočty.
Spektrální analýza pomocí Hammingova a pravoúhlého okna.
Krátkodobá energie a počet průchodů nulou u (ne)znělé řeči.
Detekce řeč/ticho a určení hranic slov.
Předpověď signálu a jeho spektrum pomocí lineární predikce.
Transformace řečových příznaků.
Určení korelace mezi různými parametry řeči.
Výpočet vzdáleností mezi úseky řečového signálu.
Automatické rozpoznání neznámého slova.
Segmentace slovních spojení na fonetické úseky.
Určení základního tónu řeči metodou klipování středu.
Cepstrální analýza znělé řeči.
Identifikace různých mluvčích.