Detail předmětu
Vybrané problémy získávání znalostí z databází
FIT-ZZDAk. rok: 2018/2019
- Prohloubení znalostí základů získávání znalostí z databází - základy metod předzpracování (statistické veličiny používané při sumarizaci, přístupy k číštění, transformaci a redukci dat), základy datových skladů, základní metody a algoritmy dolování frekventovaných vzorů a asociačních pravidel (algoritmus Apriori, FP-strom, víceúrovňová asociační pravidla, dolování vícedimenzionálních asociačních pravidel z relačních databází), základní metody a algoritmy klasifikace (rozhodovací strom, bayesovská klasifikace, klasifikace využitím neuronových sítí, SVM) a predikce (lineární a nelineární regrese), základní metody a algoritmy shlukové analýzy (způsoby vyjadřování vzdálenosti dat, rozčleňovací metody, hierarchické metody, CF-strom, metody založené na hustotě, metody založené na mřížce a na modelu).
- Pokročilé techniky dolování dat - pokročilé techniky dolování znalostí z 'klasických' zdrojů dat, techniky dolování v proudech dat, časových řadách a posloupnostech, dolování v biologických datech, dolování v grafových strukturách, multirelační dolování, dolování v objektových, prostorových a multimediálních datech, dolování v textu, dolování na WWW.
Část 1 představuje základní témata.Dobrá znalost v této oblasti se očekává od všech absolventů předmětu. Tato část odpovídá kapitolám 1 až 12 v učebnici [1]. V části 2 se očekává od studentů přehled a porozumění základům (formulace problému, základní charakteristika přístupů k řešení) u všech témat. Hlubší znalosti se vyžaduje u tématu, které zpracovali a prezentovali na závěrečném semináři předmětu. Toto téma zpravidla nějak souvisí se zaměřením disertační práce. Tato část odpovídá kapitolám 8 až 10 v učebnici [2], ale zejména se předpokládá využití nejnovějších zdrojů informací dostupných ve sbornících z konferencí a v časopisech.
Okruhy otázek k SDZ:
- Předzpracování dat pro dolování.
- Dolování frekventovaných položek a asociačních pravidel.
- Klasifikace - rozhodovací stromy a bayesovská klasifikace.
- Klasifikace využitím neuronových sítí, SVM.
- Predikce.
- Shlukování - způsoby vyjadřování vzdálenosti, klasifikace metod a jejich charakteristika.
- Shlukování - rozčleňovací a hierarchické metody.
- Shlukování - metody založené na hustotě a mřížce.
- Dolování v proudech dat.
- Dolování na webu.
Jazyk výuky
Garant předmětu
Zajišťuje ústav
Výsledky učení předmětu
Prerekvizity
Způsob a kritéria hodnocení
Učební cíle
Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky
Doporučená literatura
Bishop, CH. M.: Pattern Recognition and Machine Learning. Springer, 2006, 738 p. ISBN 978-0-387-31073-2.
Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Second Edition. Elsevier Inc., 2006, 770 p. ISBN 1-55860-901-3.
Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Third Edition. Elsevier Inc., 2012, 703 p. ISBN 978-0-12-381479-1.
Papers in journals and conference proceedings (including those in ACM Digital library, IEEE Digital library and other electronic sources).
Zařazení předmětu ve studijních plánech
Typ (způsob) výuky
Přednáška
Vyučující / Lektor
Osnova
- Předzpracování dat.
- Datové sklady.
- Asociační analýza.
- Klasifikace a predikce.
- Shluková analýza.
- Pokročilé techniky dolování znalostí z 'klasických' zdrojů dat.
- Dolování v proudech dat.
- Dolování v časových řadách a posloupnostech.
- Dolování v biologických datech.
- Dolování v grafových strukturách.
- Dolování v objektových, prostorových a multimediálních datech.
- Dolování v textu a na WWW.
- Dolování v datech pohybujících se objektů.
Projekt
Vyučující / Lektor
Osnova
- Prostudování a zpracování vybraného tématu týkajícího se získávání znalostí z dat, zpravidla souvisejícího s tématem disertační práce studenta. Prezentace zpracovaného tématu na závěrečném semináři.
Konzultace v kombinovaném studiu
Vyučující / Lektor