Detail předmětu

Speech Signal Analysis and Synthesis

FEKT-MATeAk. rok: 2011/2012

Fonetický popis českého jazyka, váhování signálu, preemfáze, určení základního tónu řeči, parametrický popis řečového signálu v časové a kmitočtové oblasti, krátkodobá analýza řečového signálu, metody výběru vhodných příznaků, určení začátku a konce slov, lineární a nelineární časové transformace, systémy na rozpoznávání slov a slovních spojení, vhodné řečové jednotky a příznaky na rozpoznávání mluvčího, skryté Markovovy modely, identifikace a verifikace mluvčích, metody syntézy řeči, vokodéry, speciální integrované obvody na zpracování řeči, typické aplikace na rozpoznávání řeči a mluvčích.

Jazyk výuky

angličtina

Počet kreditů

8

Výsledky učení předmětu

Studenti se seznámí s fonetickým popisem českého jazyka, parametry řečového signálu, metodami výběru vhodných řečových příznaků, systémy na rozpoznávání řeči a rozpoznávání mluvčích, metodami syntézy řeči, vokodéry pro přenos řeči, speciálními integrovanými obvody na zpracování řeči a různými aplikacemi.

Prerekvizity

Jsou požadovány znalosti na úrovni bakalářského studia.

Plánované vzdělávací činnosti a výukové metody

Metody vyučování závisejí na způsobu výuky a jsou popsány článkem 7 Studijního a zkušebního řádu VUT.

Způsob a kritéria hodnocení

Počítačová cvičení za 30 bodů během semestru a písemná zkouška za 70 bodů.

Osnovy výuky

Základní orientace, akustická teorie vytváření řeči.
Hlasový trakt, fonetický popis českého jazyka.
Předzpracování řečového signálu: váhování, preemfáze.
Energie, počet průchodů nulou, autokorelační koeficienty.
Lineární prediktivní kódování a odvozené koeficienty.
Cepstrální analýza řečového signálu.
Určování základního tónu řeči.
Lineární a nelineární časové transformace.
Deterministické a statistické klasifikátory, skryté Markovovy modely.
Učení klasifikátoru, měření úspěšnosti klasifikace.
Rozpoznávání hlasu, ověřování a identifikace mluvčích.
Metody syntézy řeči.
Základní způsoby přenosu řeči, hlavní typy vokodérů.

Učební cíle

Cílem předmětu je seznámit studenty se základními metodami pro automatické rozpoznávání vyslovených slov, postupy při verifikaci a identifikaci mluvčích na základě jejich hlasu a metodami syntézy řeči.

Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky

Absolvování všech počítačových cvičení

Základní literatura

JELINEK, F., Statistical Methods for Speech Recognition. The MIT Press, Cambridge, MA, 1997.
KATAGIRI, S., Handbook of Neural Networks for Speech Processing. Artech House, London, 2000.
RABINER, R., JUANG, B. H., Fundamentals of Speech Recognition. Prentice Hall, Englewood Cliffs, N.J., 1993.

Zařazení předmětu ve studijních plánech

  • Program EEKR-MN magisterský navazující

    obor MN-EST , 1 ročník, letní semestr, volitelný oborový

Typ (způsob) výuky

 

Přednáška

39 hod., nepovinná

Vyučující / Lektor

Osnova

Základní orientace, akustická teorie vytváření řeči.
Hlasový trakt, fonetický popis českého jazyka.
Předzpracování řečového signálu: váhování, preemfáze.
Energie, počet průchodů nulou, autokorelační koeficienty.
Lineární prediktivní kódování a odvozené koeficienty.
Cepstrální analýza řečového signálu.
Určování základního tónu řeči.
Lineární a nelineární časové transformace.
Deterministické a statistické klasifikátory, skryté Markovovy modely.
Učení klasifikátoru, měření úspěšnosti klasifikace.
Rozpoznávání hlasu, ověřování a identifikace mluvčích.
Metody syntézy řeči.
Základní způsoby přenosu řeči, hlavní typy vokodérů.

Cvičení na počítači

52 hod., povinná

Vyučující / Lektor

Osnova

Časový průběh řeči, vyhledávání jednotlivých fonémů.
Spektra samohlásek, formantové kmitočty.
Spektrální analýza pomocí Hammingova a pravoúhlého okna.
Krátkodobá energie a počet průchodů nulou u (ne)znělé řeči.
Detekce řeč/ticho a určení hranic slov.
Předpověď signálu a jeho spektrum pomocí lineární predikce.
Automatické rozpoznání samohlásek.
Určení korelace mezi různými parametry řeči.
Výpočet vzdáleností mezi úseky řečového signálu.
Automatické rozpoznání neznámého slova.
Segmentace slovních spojení na fonetické úseky.
Určení základního tónu řeči metodou klipování středu.
Cepstrální analýza znělé řeči.
Identifikace různých mluvčích.