Detail předmětu

Ukládání a příprava dat

FIT-UPAAk. rok: 2020/2021

Předmět se zaměřuje na moderní databázové systémy jako typické zdroje dat pro získávání znalostí a dále na přípravu dat k získávání znalostí. Jedná se o rozšířené relační (objektově-relační, s podporou pro práci s XML a JSON dokumenty), prostorové a NoSQL databázové systémy. Vysvětlený je odpovídající databázový model, způsob práce s daty a některé metody indexace dat. V kontextu výkladu základních kroků procesu získávání znalostí z dat je věnována pozornost popisným charakteristíkám dat a vizualizačním technikám používaným k pochopení dat a jejich vlastností. Dále jsou vysvětleny přístupy řešení typických úloh předzpracování dat pro získávání znalostí, jako je čištění, integrace, transformace, redukce apod. Rovněž jsou prezentovány přístupy k extrakci informace z webu pro účely získávání znalostí, charakterizovány nejčastěji používané jazyky a systémy pro získávání znalostí z dat a je uvedeno několik reálných případových studií.
V rámci předmětu studenti řeší projekt zaměřený na ...

Jazyk výuky

čeština

Počet kreditů

5

Výsledky učení předmětu

Studenti budou schopni ukládat a manipulovat data ve vhodných databázových systémech, zkoumat vlastnosti dat a připravit je pro následné modelování v rámci získávání znalostí.
  • Student lépe zvládne práci s daty v různých situacích.
  • Student se zdokonalí v řešení malých projektů v malém týmu.

Prerekvizity

  • Základy relačních databází a jazyka SQL.
  • Objektově orientované paradigma.
  • Základy jazyka XML.
  • Základy výpočetní geometrie.
  • Základy statistiky a pravděpodobnosti.

Způsob a kritéria hodnocení

  • Půlsemestrální zkouška, u které neexistuje náhradní, či opravný termín.
  • Řešení 1 projektu v průběhu semestru a jeho odevzdání ve stanoveném termínu.

Podmínky zápočtu:
Student musí během semestru získat alespoň 50% bodů z možného maxima, tj. 20 bodů ze 40.
Pokud bude odhaleno plagiátorství nebo nedovolená spolupráce na projektech, či u půlsemestrální zkoušky, zápočet nebude udělen a dále bude zváženo zahájení disciplinárního řízení.

Učební cíle

Cílem předmětu je vysvětlit historický vývoj databázových technologií, motivaci získávání znalostí z dat a základní kroky procesu získávání znalostí, vysvětlit podstatu, vlastnosti a použití rozšířených relačních a NoSQL databází jako zdrojů dat pro získávání znalostí a vysvětlit přístupy a metody používané pro pochopení dat a přípravu dat pro získávání znalostí.

Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky

  • Půlsemestrální písemná zkouška, neexistuje náhradní/opravný termín, omluvené neúčasti řeší garant.
  • Formulace dolovací úlohy v předepsaném termínu, omluvené neúčasti řeší cvičící.
  • Prezentace výsledků projektu v předepsaném termínu, omluvené neúčasti řeší cvičící.
  • Závěrečná zkouška, pro získání bodů ze zkoušky je nutné zkoušku vypracovat tak, aby byla hodnocena nejméně 20 body. V opačném případě bude zkouška hodnocena 0 body. Omluvenou neúčast řeší garant.

Zařazení předmětu ve studijních plánech

  • Program MITAI magisterský navazující

    specializace NISY , 0 ročník, zimní semestr, povinný
    specializace NADE , 1 ročník, zimní semestr, povinný
    specializace NBIO , 1 ročník, zimní semestr, povinný
    specializace NCPS , 1 ročník, zimní semestr, povinný
    specializace NEMB , 0 ročník, zimní semestr, povinný
    specializace NHPC , 0 ročník, zimní semestr, povinný
    specializace NGRI , 0 ročník, zimní semestr, povinný
    specializace NIDE , 1 ročník, zimní semestr, povinný
    specializace NISD , 1 ročník, zimní semestr, povinný
    specializace NMAL , 1 ročník, zimní semestr, povinný
    specializace NMAT , 0 ročník, zimní semestr, povinný
    specializace NNET , 1 ročník, zimní semestr, povinný
    specializace NSEC , 0 ročník, zimní semestr, povinný
    specializace NSEN , 1 ročník, zimní semestr, povinný
    specializace NSPE , 1 ročník, zimní semestr, povinný
    specializace NVER , 0 ročník, zimní semestr, povinný
    specializace NVIZ , 1 ročník, zimní semestr, povinný

Typ (způsob) výuky

 

Přednáška

26 hod., nepovinná

Vyučující / Lektor

Osnova

  1. Historie vývoje databázových technologií a získávání znalostí z dat, proces získávání znalostí z dat.
  2. Objektový přístup v databázích.
  3. NoSQL databáze I - úvod do NoSQL, CAP teorém a BASE, databáze klíč-hodnota a způsob uložení dat, rozdělení (partitioning) a distribuce dat.
  4. NoSQL databáze II - modely dat v NoSQL databázích (sloupcové, dokumentové a grafové databáze), dotazování a agregace dat, NewSQL databáze.
  5. Extrakce dat z webu (web scraping).
  6. Příprava dat - porozumění datům: popisné charakteristiky, vizualizační techniky, korelační analýza.
  7. Příprava dat - předzpracování I: čištění dat, integrace.
  8. Příprava dat - předzpracování II: redukce dat a řešení nevyváženosti dat, transformace dat, další úlohy předzpracování.
  9. Půlsemestrální zkouška.
  10. Jazyky a systémy pro získávání znalostí z dat, reálné případové studie.
  11. Podpora pro práci s XML a JSON dokumenty v databázích.
  12. Prostorové databáze.
  13. Indexování vícedimenzionálních dat.

Cvičení odborného základu

6 hod., povinná

Vyučující / Lektor

Osnova

DEMO cvičení
  1. Objektově-relační a prostorové databáze, práce v nich, zvláštnosti užití
  2. Multimediální a XML databáze, indexace dat
  3. NoSQL databáze

Cvičení na počítači

6 hod., povinná

Vyučující / Lektor

Osnova

  1. Aplikační vazby na objektově relační databáze, aplikace v prostorových databázích
  2. Multimediální a XML databáze, indexace dat
  3. NoSQL databáze v aplikacích

Projekt

14 hod., povinná

Vyučující / Lektor

Osnova

  1. Vytvoření aplikace a demonstrace vlastností práce s nestrukturovanými i strukturovanými daty různé povahy.