Detail předmětu
Zpracování řečových signálů
FIT-ZREAk. rok: 2024/2025
Aplikace počítačového zpracování řeči, číslicové zpracování řečových signálů, tvorba a slyšení řeči, úvod do fonetiky, předzpracování a základní parametry, lineárně-prediktivní model, cepstrum, určování základního tónu hlasu, kódování - časová oblast a vokodéry, rozpoznávání - DTW a HMM, syntéza. Software a knihovny pro zpracování řeči.
Jazyk výuky
Počet kreditů
Garant předmětu
Zajišťuje ústav
Pravidla hodnocení a ukončení předmětu
- půlsemestrální test 14b
- projekt 29b
- presentace výsledků na poč. cvičeních 6b
Učební cíle
Studenti se seznámí se základními charakteristikami řečového signálu v návaznosti na tvorbu a slyšení řeči lidmi. Pochopí základní algoritmy analýzy řeči společné mnohým aplikacím. Získají přehled o aplikacích (rozpoznávání, syntéza, kódování) a o praktických stránkách implementace řečových algoritmů. Budou schopni navrhnout jednoduchý systém pro zpracování řeči (detektor řečové aktivity, rozpoznávač několika izolovaných slov), včetně implementace do aplikačních programů.
Základní literatura
Psutka, J.: Komunikace s počítačem mluvenou řečí. Academia, Praha, 1995, ISBN 80-200-0203-0
www stránka předmětu https://www.fit.vutbr.cz/study/courses/ZRE/public/
Doporučená literatura
Psutka, J., Müller, L., Matoušek, J., & Radová, V., Mluvíme s počítačem česky, Academia, 2006.
Rabiner, L. R., & Schafer, R. W. Theory and applications of digital speech processing, Pearson, 2011.
Yu, D., Deng, L., Automatic speech recognition, Springer, 2016.
Zařazení předmětu ve studijních plánech
- Program MITAI magisterský navazující
specializace NGRI , 0 ročník, letní semestr, volitelný
specializace NADE , 0 ročník, letní semestr, volitelný
specializace NISD , 0 ročník, letní semestr, volitelný
specializace NMAT , 0 ročník, letní semestr, volitelný
specializace NSEC , 0 ročník, letní semestr, volitelný
specializace NISY do 2020/21 , 0 ročník, letní semestr, volitelný
specializace NNET , 0 ročník, letní semestr, volitelný
specializace NMAL , 0 ročník, letní semestr, volitelný
specializace NCPS , 0 ročník, letní semestr, volitelný
specializace NHPC , 0 ročník, letní semestr, volitelný
specializace NVER , 0 ročník, letní semestr, volitelný
specializace NIDE , 0 ročník, letní semestr, volitelný
specializace NISY , 0 ročník, letní semestr, volitelný
specializace NEMB do 2023/24 , 0 ročník, letní semestr, volitelný
specializace NSPE , 0 ročník, letní semestr, povinný
specializace NEMB , 0 ročník, letní semestr, volitelný
specializace NBIO , 0 ročník, letní semestr, volitelný
specializace NSEN , 0 ročník, letní semestr, volitelný
specializace NVIZ , 0 ročník, letní semestr, volitelný
Typ (způsob) výuky
Přednáška
Vyučující / Lektor
Osnova
- Úvod, aplikace zpracování řeči.
- Číslicové zpracování řečových signálů.
- Tvorba a řeči a její signálový model.
- Předzpracování a základní parametry, cepstrum.
- Lineárně-prediktivní model.
- Určování základního tónu hlasu
- Kódování řeči - základy.
- Kódování řeči CELP.
- Základy rozpoznávání řeči, DTW.
- Skryté Markovovy modely HMM.
- Systémy pro rozpoznávání řeči s velkým slovníkem (LVCSR).
- Rozpoznávání mluvčího a jazyka. Využití neuronových sítí ve zpracování řeči.
- Syntéza řeči z textu.
Cvičení odborného základu
Vyučující / Lektor
Osnova
- Paramatrizace, DTW, HMM.
Cvičení na počítači
Vyučující / Lektor
Osnova
- V laboratořích (kromě poslední) je používán Matlab.
- Úvod.
- Lineární predikce a vektorové kvantování.
- Určování základního tónu a kódování řeči.
- Základy klasifikace.
- Rozpoznávání - Dynamic time Warping (DTW).
- Rozpoznávání - skryté Markovovy modely (HTK).