Detail předmětu

Získávání znalostí z databází

FIT-ZZNAk. rok: 2020/2021

Datové sklady. Techniky dolování různých typů znalostí -  asociační pravidla, klasifikace a predikce, shlukování. Dolování v netradičních datech - proudech dat, časových řadách a posloupnostech, grafech, prostorových a časoprostorových datech, multimediálních datech. Dolování v textu a na webu. Vypracování projektu využitím dostupného nástroje pro dolování v datech.

Jazyk výuky

čeština

Počet kreditů

5

Výsledky učení předmětu

  • Studenti získají dostatečně široký a přitom i dostatečně do hloubky jdoucí přehled v oblasti získávání znalostí z dat.
  • Jsou schopni nástroje pro získávání znalostí používat i vytvářet.

  • Student se naučí odborné terminologii v českém i anglickém jazyce.
  • Student získá zkušenost s řešením projektů v malém týmu.
  • Student se zdokonalí v prezentaci a obhajobě výsledků projektu.

Prerekvizity

  • Znalost základních kroků procesu získávání znalostí z dat a metod přípravy dat pro krok modelování dat (probráno v předmětu UPA - Ukládání a příprava dat).
  • Znalost základů pravděpodobnosti a statistiky.
  • Znalost databázových technologií na úrovni bakalářského předmětu.

Způsob a kritéria hodnocení

Půlsemestrální písemná zkouška, formulace dolovací úlohy, obhajoba projektu.
Podmínky zápočtu:
Udělení zápočtu je podmíněno vypracováním projektu, jeho obhajobou v předepsaných termínech a ziskem minimálně 24 bodů za bodované aktivity v průběhu semestru.

Učební cíle

Seznámit studenty s metodami a algoritmy modelování dat pro získávání znalostí z nich.

Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky

  • Půlsemestrální písemná zkouška, neexistuje náhradní/opravný termín, omluvené neúčasti řeší garant.
  • Formulace dolovací úlohy v předepsaném termínu, omluvené neúčasti řeší cvičící.
  • Prezentace výsledků projektu v předepsaném termínu, omluvené neúčasti řeší cvičící.
  • Závěrečná zkouška, pro získání bodů ze zkoušky je nutné zkoušku vypracovat tak, aby byla hodnocena nejméně 20 body. V opačném případě bude zkouška hodnocena 0 body. Omluvenou neúčast řeší garant.

Základní literatura

Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Third Edition. Morgan Kaufmann Publishers, 2012, 703 p., ISBN 978-0-12-381479-1.Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Second Edition. Elsevier Inc., 2006, 770 p., ISBN 1-55860-901-3.    

Doporučená literatura

Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Third Edition. Morgan Kaufmann Publishers, 2012, 703 p., ISBN 978-0-12-381479-1.

Zařazení předmětu ve studijních plánech

  • Program IT-MGR-2 magisterský navazující

    obor MGM , 2 ročník, zimní semestr, volitelný
    obor MBI , 2 ročník, zimní semestr, povinný
    obor MBS , 0 ročník, zimní semestr, povinně volitelný
    obor MIN , 2 ročník, zimní semestr, povinný
    obor MIS , 2 ročník, zimní semestr, povinně volitelný
    obor MMI , 0 ročník, zimní semestr, volitelný
    obor MMM , 0 ročník, zimní semestr, volitelný
    obor MPV , 0 ročník, zimní semestr, povinně volitelný
    obor MSK , 2 ročník, zimní semestr, povinně volitelný

  • Program MITAI magisterský navazující

    specializace NISY , 0 ročník, zimní semestr, povinný
    specializace NADE , 0 ročník, zimní semestr, volitelný
    specializace NBIO , 0 ročník, zimní semestr, povinný
    specializace NCPS , 0 ročník, zimní semestr, volitelný
    specializace NEMB , 0 ročník, zimní semestr, volitelný
    specializace NHPC , 0 ročník, zimní semestr, volitelný
    specializace NGRI , 0 ročník, zimní semestr, volitelný
    specializace NIDE , 0 ročník, zimní semestr, volitelný
    specializace NISD , 2 ročník, zimní semestr, povinný
    specializace NMAL , 0 ročník, zimní semestr, volitelný
    specializace NMAT , 0 ročník, zimní semestr, volitelný
    specializace NNET , 0 ročník, zimní semestr, volitelný
    specializace NSEC , 0 ročník, zimní semestr, volitelný
    specializace NSEN , 0 ročník, zimní semestr, volitelný
    specializace NSPE , 0 ročník, zimní semestr, volitelný
    specializace NVER , 0 ročník, zimní semestr, volitelný
    specializace NVIZ , 0 ročník, zimní semestr, volitelný

Typ (způsob) výuky

 

Přednáška

39 hod., nepovinná

Vyučující / Lektor

Osnova

  1. Datové sklady a technologie OLAP pro získávání znalostí z dat.
  2. Dolování frekventovaných vzorů a asociací - základní pojmy. Dolování frekventovaných vzorů a asociací - efektivní a škálovatelné metody hledání frekventovaných množin.
  3. Víceúrovňová asociační pravidla, asociační a korelační analýza, omezená asociační pravidla.
  4. Prediktivní modelování - základní pojmy, metody klasifikace - rozhodovací strom, bayesovská klasifikace, klasifikace založená na pravidlech.
  5. Klasifikace s využitím neuronových sítí. SVM klasifikátor, náhodné lesy.
  6. Další metody klasifikace a regrese. Hodnocení kvality výsledků klasifikace a regrese.
    Shluková analýza - základní pojmy, typy dat při shlukování.
  7. Metody shlukování založené na rozčleňování. Hierarchické metody shlukování. Další metody shlukování. Vyhodnocení kvality shluků.
  8. Analýza odlehlých hodnot. Dolování v biologických datech.
  9. Úvod do získávání znalostí z proudů dat a z časových řad.
  10. Úvod do získávání znalostí v sekvencích, z grafů, dat pohybujících se objektů a multimediálních dat.
  11. Dolování textu.
  12. Dolování na webu.
  13. Další vybraná témata (dolování v datech procesů, doporučovací systémy, dolování v rozlehlých datech).

Projekt

13 hod., povinná

Vyučující / Lektor

Osnova

  • Vypracování projektu v prostředí dostupného nástroje pro získávání znalostí z dat.