Detail předmětu
Zpracování řeči
FEKT-MPC-ZREAk. rok: 2025/2026
Předmět podává ucelený pohled na různé současné oblasti zpracování řečových signálů, které se ve verbální komunikaci objevují. Nejprve je uveden způsob tvorby řeči a její vnímání a je popsáno sluchové ústrojí člověka a proces slyšení. Potom jsou probrány segmentální a suprasegmentální parametry, které se při analýze řeči nejvíce používají. Dále pak jsou zmíněny všechny důležité oblasti zpracování řeči, především analýza řeči, rozpoznávání vzoru, syntéza a kódování řeči. S tím jsou spojené metody analýzy základního tónu řeči, modelování prozodie, emoční analýza, analýza řečových patologií, de-identifikace řeči, vodoznační řeči atd. Dále je pozornost věnována jednokanálovým a vícekanálovým metodám zvýraznění řeči a potlačení šumu. Nakonec jsou popsány objektivní a subjektivní metody posuzování kvality a srozumitelnosti řeči.
Jazyk výuky
Počet kreditů
Garant předmětu
Zajišťuje ústav
Vstupní znalosti
Pravidla hodnocení a ukončení předmětu
Vymezení kontrolované výuky a způsob jejího provádění stanoví každoročně aktualizovaná vyhláška garanta předmětu.
Učební cíle
Absolvent předmětu je schopen:
- popsat hlasové a sluchové ústrojí, způsob tvorby řeči a její vnímání
- analyzovat řeč pomocí nejpoužívanějších segmentálních a suprasegmentálních parametrů
- využívat kepstrální a lineární predikční analýzu
- využívat strojové učení v oblasti zpracování řeči (rozpoznávání řeči, rozpoznávání řečníků, identifikace řečových patologií, identifikace emocí řečníka atd.)
- navrhnout a realizovat systém TTS (text-to-speech) založený na konkatenační syntéze
- modelovat hlasový trakt a provádět kódování řeči
- používat objektivní a subjektivní testy kvality a srozumitelnosti řeči
- zvýrazňovat řeč jednokanálovými a vícekanálovými metodami
- navrhnout systém vodoznačení a de-identifikace řeči
- zpracovávat/analyzovat řečové signály v prostředí Matlab
Základní literatura
SMÉKAL, Z. Zpracování řeči. Brno: Vysoké učení technické v Brně, 2012. s. 1-171. ISBN: 978-80-214-4896-4. (CS)
Zařazení předmětu ve studijních plánech
Typ (způsob) výuky
Přednáška
Vyučující / Lektor
Osnova
2. Analýza řečových signálů, segmentální a suprasegmentální parametry I, analýza základního tónu řeči
3. Analýza řečových signálů, segmentální a suprasegmentální parametry II
4. Analýza řečových signálů III, rozpoznávání vzoru (klasifikace založená na vzdálenostech)
5. Rozpoznávání vzoru (statistické klasifikátory)
6. Syntéza řeči a systémy typu TTS, modelování prozodie
7. Kódování řeči a její přenos
8. Objektivní a subjektivní metody posuzování kvality řeči a její srozumitelnosti
9. Jednokanálové a vícekanálové metody zvýrazňování řeči
10. Analýza emocí a její aplikace
11. Analýza neurodegenerativních onemocnění
12. Vodoznační řeči, de-identifikace řeči
Laboratorní cvičení
Vyučující / Lektor
Osnova
1. Fonetická a akustická analýza prvků řeči. Předzpracování řečových signálů.
2. Suprasegmentální rysy
3. Lineární predikční analýza řeči
4. Kepstrální analýza řeči
5. Rozpoznávání vzoru
6. Klasifikátory. Redukce příznakového prostoru.
7. Systémy TTS
8. Registrace projektů a písemný test
9. Práce na projektech
10. Práce na projektech
11. Práce na projektech
12. Odevzdávání a obhajoba projektů