Detail předmětu
Získávání znalostí z databází
FIT-ZZNAk. rok: 2020/2021
Datové sklady. Techniky dolování různých typů znalostí - asociační pravidla, klasifikace a predikce, shlukování. Dolování v netradičních datech - proudech dat, časových řadách a posloupnostech, grafech, prostorových a časoprostorových datech, multimediálních datech. Dolování v textu a na webu. Vypracování projektu využitím dostupného nástroje pro dolování v datech.
Jazyk výuky
Počet kreditů
Garant předmětu
Zajišťuje ústav
Výsledky učení předmětu
- Studenti získají dostatečně široký a přitom i dostatečně do hloubky jdoucí přehled v oblasti získávání znalostí z dat.
- Jsou schopni nástroje pro získávání znalostí používat i vytvářet.
- Student se naučí odborné terminologii v českém i anglickém jazyce.
- Student získá zkušenost s řešením projektů v malém týmu.
- Student se zdokonalí v prezentaci a obhajobě výsledků projektu.
Prerekvizity
- Znalost základních kroků procesu získávání znalostí z dat a metod přípravy dat pro krok modelování dat (probráno v předmětu UPA - Ukládání a příprava dat).
- Znalost základů pravděpodobnosti a statistiky.
- Znalost databázových technologií na úrovni bakalářského předmětu.
Způsob a kritéria hodnocení
Podmínky zápočtu:
Udělení zápočtu je podmíněno vypracováním projektu, jeho obhajobou v předepsaných termínech a ziskem minimálně 24 bodů za bodované aktivity v průběhu semestru.
Učební cíle
Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky
- Půlsemestrální písemná zkouška, neexistuje náhradní/opravný termín, omluvené neúčasti řeší garant.
- Formulace dolovací úlohy v předepsaném termínu, omluvené neúčasti řeší cvičící.
- Prezentace výsledků projektu v předepsaném termínu, omluvené neúčasti řeší cvičící.
- Závěrečná zkouška, pro získání bodů ze zkoušky je nutné zkoušku vypracovat tak, aby byla hodnocena nejméně 20 body. V opačném případě bude zkouška hodnocena 0 body. Omluvenou neúčast řeší garant.
Základní literatura
Doporučená literatura
Zařazení předmětu ve studijních plánech
- Program IT-MGR-2 magisterský navazující
obor MGM , 2 ročník, zimní semestr, volitelný
obor MBI , 2 ročník, zimní semestr, povinný
obor MBS , 0 ročník, zimní semestr, povinně volitelný
obor MIN , 2 ročník, zimní semestr, povinný
obor MIS , 2 ročník, zimní semestr, povinně volitelný
obor MMI , 0 ročník, zimní semestr, volitelný
obor MMM , 0 ročník, zimní semestr, volitelný
obor MPV , 0 ročník, zimní semestr, povinně volitelný
obor MSK , 2 ročník, zimní semestr, povinně volitelný - Program MITAI magisterský navazující
specializace NISY , 0 ročník, zimní semestr, povinný
specializace NADE , 0 ročník, zimní semestr, volitelný
specializace NBIO , 0 ročník, zimní semestr, povinný
specializace NCPS , 0 ročník, zimní semestr, volitelný
specializace NEMB , 0 ročník, zimní semestr, volitelný
specializace NHPC , 0 ročník, zimní semestr, volitelný
specializace NGRI , 0 ročník, zimní semestr, volitelný
specializace NIDE , 0 ročník, zimní semestr, volitelný
specializace NISD , 2 ročník, zimní semestr, povinný
specializace NMAL , 0 ročník, zimní semestr, volitelný
specializace NMAT , 0 ročník, zimní semestr, volitelný
specializace NNET , 0 ročník, zimní semestr, volitelný
specializace NSEC , 0 ročník, zimní semestr, volitelný
specializace NSEN , 0 ročník, zimní semestr, volitelný
specializace NSPE , 0 ročník, zimní semestr, volitelný
specializace NVER , 0 ročník, zimní semestr, volitelný
specializace NVIZ , 0 ročník, zimní semestr, volitelný
Typ (způsob) výuky
Přednáška
Vyučující / Lektor
Osnova
- Datové sklady a technologie OLAP pro získávání znalostí z dat.
- Dolování frekventovaných vzorů a asociací - základní pojmy. Dolování frekventovaných vzorů a asociací - efektivní a škálovatelné metody hledání frekventovaných množin.
- Víceúrovňová asociační pravidla, asociační a korelační analýza, omezená asociační pravidla.
- Prediktivní modelování - základní pojmy, metody klasifikace - rozhodovací strom, bayesovská klasifikace, klasifikace založená na pravidlech.
- Klasifikace s využitím neuronových sítí. SVM klasifikátor, náhodné lesy.
- Další metody klasifikace a regrese. Hodnocení kvality výsledků klasifikace a regrese.
Shluková analýza - základní pojmy, typy dat při shlukování. - Metody shlukování založené na rozčleňování. Hierarchické metody shlukování. Další metody shlukování. Vyhodnocení kvality shluků.
- Analýza odlehlých hodnot. Dolování v biologických datech.
- Úvod do získávání znalostí z proudů dat a z časových řad.
- Úvod do získávání znalostí v sekvencích, z grafů, dat pohybujících se objektů a multimediálních dat.
- Dolování textu.
- Dolování na webu.
- Další vybraná témata (dolování v datech procesů, doporučovací systémy, dolování v rozlehlých datech).
Projekt
Vyučující / Lektor
Osnova
- Vypracování projektu v prostředí dostupného nástroje pro získávání znalostí z dat.