Detail předmětu
Zpracování řeči
FEKT-MPC-ZREAk. rok: 2023/2024
Předmět podává ucelený pohled na různé současné oblasti zpracování řečových signálů, které se ve verbální komunikaci objevují. Nejprve je uveden způsob tvorby řeči a její vnímání a je popsáno sluchové ústrojí člověka a proces slyšení. Potom jsou probrány segmentální a suprasegmentální parametry, které se při analýze řeči nejvíce používají. Dále pak jsou zmíněny všechny důležité oblasti zpracování řeči, především analýza řeči, rozpoznávání vzoru, syntéza a kódování řeči. S tím jsou spojené metody analýzy základního tónu řeči, modelování prozodie, emoční analýza, analýza řečových patologií, de-identifikace řeči, vodoznační řeči atd. Dále je pozornost věnována jednokanálovým a vícekanálovým metodám zvýraznění řeči a potlačení šumu. Nakonec jsou popsány objektivní a subjektivní metody posuzování kvality a srozumitelnosti řeči.
Jazyk výuky
Počet kreditů
Garant předmětu
Zajišťuje ústav
Vstupní znalosti
Pravidla hodnocení a ukončení předmětu
Vymezení kontrolované výuky a způsob jejího provádění stanoví každoročně aktualizovaná vyhláška garanta předmětu.
Učební cíle
Absolvent předmětu je schopen:
- popsat hlasové a sluchové ústrojí, způsob tvorby řeči a její vnímání
- analyzovat řeč pomocí nejpoužívanějších segmentálních a suprasegmentálních parametrů
- využívat kepstrální a lineární predikční analýzu
- využívat strojové učení v oblasti zpracování řeči (rozpoznávání řeči, rozpoznávání řečníků, identifikace řečových patologií, identifikace emocí řečníka atd.)
- navrhnout a realizovat systém TTS (text-to-speech) založený na konkatenační syntéze
- modelovat hlasový trakt a provádět kódování řeči
- používat objektivní a subjektivní testy kvality a srozumitelnosti řeči
- zvýrazňovat řeč jednokanálovými a vícekanálovými metodami
- navrhnout systém vodoznačení a de-identifikace řeči
- zpracovávat/analyzovat řečové signály v prostředí Matlab
Základní literatura
SMÉKAL, Z. Zpracování řeči. Brno: Vysoké učení technické v Brně, 2012. s. 1-171. ISBN: 978-80-214-4896-4. (CS)
Elearning
Zařazení předmětu ve studijních plánech
Typ (způsob) výuky
Přednáška
Vyučující / Lektor
Osnova
2. Analýza řečových signálů, segmentální a suprasegmentální parametry I, analýza základního tónu řeči
3. Analýza řečových signálů, segmentální a suprasegmentální parametry II
4. Analýza řečových signálů III, rozpoznávání vzoru (klasifikace založená na vzdálenostech)
5. Rozpoznávání vzoru (statistické klasifikátory)
6. Syntéza řeči a systémy typu TTS, modelování prozodie
7. Kódování řeči a její přenos
8. Objektivní a subjektivní metody posuzování kvality řeči a její srozumitelnosti
9. Jednokanálové a vícekanálové metody zvýrazňování řeči
10. Analýza emocí a její aplikace
11. Analýza neurodegenerativních onemocnění
12. Vodoznační řeči, de-identifikace řeči
Laboratorní cvičení
Vyučující / Lektor
Osnova
2. Suprasegmentální rysy
3. Lineární predikční analýza řeči
4. Kepstrální analýza řeči
5. Rozpoznávání vzoru
6. Klasifikátory. Redukce příznakového prostoru.
7. Systémy TTS
8. Registrace projektů a písemný test
9. Práce na projektech
10. Práce na projektech
11. Práce na projektech
12. Odevzdávání a obhajoba projektů
Elearning