Detail předmětu

Klasifikace a rozpoznávání

FIT-KRDAk. rok: 2017/2018

Odhady parametrů pomocí metody maximální věrohodnosti a algoritmu Expectiation-Maximization, formulace objektivní funkce diskriminativního trénování, kritérium Maximum Mutual information (MMI), adaptace GMM modelů, transformace parametrů pro rozpoznávání, modelování prostoru parametrů pomocí diskriminativních podprostorů, faktorová analýza, kernelové techniky, kalibrace a fúze klasifikátorů, aplikace v rozponávání řeči, videa a textu.

Jazyk výuky

čeština

Výsledky učení předmětu

Studenti se v rámci předmětu seznámí s pokročilými technikami klasifikace a rozpoznávání a naučí se aplikovat  metody v této oblasti na vybrané problémy rozpoznávání mluvené řeči, počítačové grafiky a zpracování přirozeného jazyka.

Studenti si vyzkouší obecné přístupy k řešení problémů klasifikace a rozpoznávání.

Prerekvizity

Základní znalost statistiky, teorie pravděpodobnosti, matematické analýzy a algebry.

Způsob a kritéria hodnocení

Hodnocení studia je založeno na bodovacím systému. Pro úspěšné absolvování předmětu je nutno dosáhnout 50 bodů.

Osnovy výuky

    Osnova přednášek:
    1. Odhad parametrů Gaussova rozdělení pravděpodobnosti pomocí Maximum Likelihood (ML)
    2. Odhad parametrů směsi Gaussových rozdělení pravděpodobnosti (Gaussian Mixture Model - GMM) pomocí Expectiation-Maximization (EM)
    3. Diskriminativní trénování, úvod, formulace objektivní funkce
    4. Diskriminativní trénování s kritériem Maximum Mutual information (MMI)
    5. Adaptace GMM modelů - Maximum A-Posteriori (MAP), Maximum Likelihood Linear Regression (MLLR)
    6. Transformace parametrů pro rozpoznávání - základy, Principal component analysis (PCA)
    7. Diskriminativní transformace parametrů - Linear Discriminant Analysis (LDA) a Heteroscedastic Linear Discriminant Analysis  (HLDA)
    8. Modelování prostoru parametrů pomocí diskriminativních podprostorů - faktorová analýza
    9. Kernelové techniky, SVM
    10. Kalibrace a fúze klasifikátorů
    11. Aplikace v rozponávání řeči, videa a textu
    12. Presentace frekventantů kursu I
    13. Presentace frekventantů kursu II

    Osnova ostatní - projekty, práce:
    • Individuálně zadávané projekty

Učební cíle

Porozumět pokročilým technikám a postupům v oblasti klasifikace a rozpoznávání a naučit se aplikovat algoritmy a metody v této oblasti na problémy  rozpoznávání mluvené řeči, počítačové grafiky a zpracování přirozeného jazyka. Seznámit se způsoby vyhodnocování úspěšnosti metod. Pochopit specifika diskriminativního trénování a vytváření hybridních systémů.

Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky

Kontrolovaná výuka zahrnuje individuální projekt.

Základní literatura

Bishop, C. M.: Pattern Recognition, Springer Science + Business Media, LLC, 2006, ISBN 0-387-31073-8.Fukunaga, K. Statistical pattern recognition, Morgan Kaufmann, 1990, ISBN 0-122-69851-7.

Doporučená literatura

Mařík,V., Štěpánková,O., Lažanský, J. a kol.: Umělá inteligence (1-4), ACADEMIA Praha, 1998-2003, ISBN 80-200-1044-0.

Zařazení předmětu ve studijních plánech

  • Program VTI-DR-4 doktorský

    obor DVI4 , 0 ročník, letní semestr, volitelný

Typ (způsob) výuky

 

Přednáška

39 hod., nepovinná

Vyučující / Lektor

Osnova

  1. Odhad parametrů Gaussova rozdělení pravděpodobnosti pomocí Maximum Likelihood (ML)
  2. Odhad parametrů směsi Gaussových rozdělení pravděpodobnosti (Gaussian Mixture Model - GMM) pomocí Expectiation-Maximization (EM)
  3. Diskriminativní trénování, úvod, formulace objektivní funkce
  4. Diskriminativní trénování s kritériem Maximum Mutual information (MMI)
  5. Adaptace GMM modelů - Maximum A-Posteriori (MAP), Maximum Likelihood Linear Regression (MLLR)
  6. Transformace parametrů pro rozpoznávání - základy, Principal component analysis (PCA)
  7. Diskriminativní transformace parametrů - Linear Discriminant Analysis (LDA) a Heteroscedastic Linear Discriminant Analysis  (HLDA)
  8. Modelování prostoru parametrů pomocí diskriminativních podprostorů - faktorová analýza
  9. Kernelové techniky, SVM
  10. Kalibrace a fúze klasifikátorů
  11. Aplikace v rozponávání řeči, videa a textu
  12. Presentace frekventantů kursu I
  13. Presentace frekventantů kursu II