Detail předmětu

Získávání znalostí z databází

FIT-ZZNAk. rok: 2009/2010

Základní pojmy související se získáváním znalostí z databází, vztah získávání znalostí a dolování dat. Zdroje dat pro získávání znalostí. Podstata a techniky předzpracování dat pro dolování. Systémy pro získávání znalostí, dotazovací jazyky pro dolování. Techniky dolování různých typů znalostí - charakterizace a diskriminace, asociační pravidla, klasifikace a predikce, shlukování. Dolování ve složitě strukturovaných datech. Trendy v získávání znalostí z dat. Řešení projektu zaměřeného na dolování dat využitím dostupného nástroje.

Jazyk výuky

čeština

Počet kreditů

5

Výsledky učení předmětu

Studenti získají dostatečně široký a přitom i dostatečně do hloubky jdoucí přehled v oblasti získávání znalostí z databází. Jsou schopni nástroje pro získávání znalostí používat i vytvářet.

Prerekvizity

Nejsou žádné prerekvizity.

Způsob a kritéria hodnocení

Udělení zápočtu je podmíněno vypracováním projektu a ziskem minimálně 25 bodů za bodované aktivity v průběhu semestru.

Osnovy výuky

  1. Úvod - motivace, základní pojmy, typy zdrojů dat a získávaných znalostí, metodologie. 
  2. Datové sklady a technologie OLAP pro získávání znalostí z databází.
  3. Předzpracování dat v procesu získávání znalostí.
  4. Dolování frekventovaných vzorů a asociací - základní pojmy, efektivní a škálovatelné metody hledání frekventovaných množin.
  5. Víceúrovňová asociační pravidla, asociační a korelační analýza, omezená asociační pravidla.
  6. Klasifikace a predikce - základní pojmy, rozhodovací strom, bayesovská klasifikace, klasifikace založená na pravidlech.
  7. Klasifikace s využitím neuronových sítí, SVM klasifikátor, další metody klasifikace, predikce.
  8. Shluková analýza - základní pojmy, typy dat při shlukování, metody založené na rozčleňování, hierarchické metody.
  9. Další metody shlukování.
  10. Dolování v proudech dat, časových řadách a posloupnostech.
  11. Dolování v grafech, Analýzasociálních sítí, multirelační dolování.
  12. Dolování v objektových, prostorových a multimediálních datech, dolování textu a na webu.
  13. Aplikace a trendy v získávání znalostí z databází.

Učební cíle

Seznámit studenty s problematikou získávání znalostí z různých typů datových zdrojů, vysvětlit typy užitečných znalostí a jednotlivé kroky procesu získávání znalostí z dat a seznámit je s technikami, algoritmy a nástroji používanými při tomto procesu.

Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky

Půlsemestrální písemná zkouška, formulace dolovací úlohy, prezentace projektu.

Základní literatura

Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Third Edition. Morgan Kaufmann Publishers, 2012, 703 p., ISBN 978-0-12-381479-1.Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Second Edition. Elsevier Inc., 2006, 770 p., ISBN 1-55860-901-3.    

Zařazení předmětu ve studijních plánech

  • Program IT-MGR-2 magisterský navazující

    obor MBI , 2 ročník, zimní semestr, povinný
    obor MBS , 0 ročník, zimní semestr, povinně volitelný
    obor MGM , 2 ročník, zimní semestr, volitelný
    obor MGM , 2 ročník, zimní semestr, volitelný
    obor MIN , 2 ročník, zimní semestr, povinný
    obor MIN , 2 ročník, zimní semestr, povinný
    obor MIS , 2 ročník, zimní semestr, povinně volitelný
    obor MIS , 2 ročník, zimní semestr, volitelný
    obor MMI , 0 ročník, zimní semestr, volitelný
    obor MMM , 0 ročník, zimní semestr, volitelný
    obor MPS , 0 ročník, zimní semestr, volitelný
    obor MPV , 1 ročník, zimní semestr, povinně volitelný
    obor MSK , 2 ročník, zimní semestr, povinně volitelný

Typ (způsob) výuky

 

Přednáška

39 hod., nepovinná

Vyučující / Lektor

Osnova

  1. Úvod - motivace, základní pojmy, typy zdrojů dat a získávaných znalostí, metodologie. 
  2. Datové sklady a technologie OLAP pro získávání znalostí z databází.
  3. Předzpracování dat v procesu získávání znalostí.
  4. Dolování frekventovaných vzorů a asociací - základní pojmy, efektivní a škálovatelné metody hledání frekventovaných množin.
  5. Víceúrovňová asociační pravidla, asociační a korelační analýza, omezená asociační pravidla.
  6. Klasifikace a predikce - základní pojmy, rozhodovací strom, bayesovská klasifikace, klasifikace založená na pravidlech.
  7. Klasifikace s využitím neuronových sítí, SVM klasifikátor, další metody klasifikace, predikce.
  8. Shluková analýza - základní pojmy, typy dat při shlukování, metody založené na rozčleňování, hierarchické metody.
  9. Další metody shlukování.
  10. Dolování v proudech dat, časových řadách a posloupnostech.
  11. Dolování v grafech, Analýzasociálních sítí, multirelační dolování.
  12. Dolování v objektových, prostorových a multimediálních datech, dolování textu a na webu.
  13. Aplikace a trendy v získávání znalostí z databází.

Projekt

13 hod., nepovinná

Vyučující / Lektor