Detail předmětu

Základy zpracování dat

FSI-SZD-AAk. rok: 2025/2026

Předmět je zaměřen na základní práci s daty: představení databází a efektivní práci s nimi; základy statistického zpracování - lineární regrese, strojové učení; vizualizace výsledků, včetně geografických výstupů. Hlavní důraz předmětu je na praktické aspekty, všechny představené koncepty jsou implementovány v programovacím jazyce python.

Jazyk výuky

angličtina

Počet kreditů

Zajišťuje ústav

Vstupní znalosti

Základy programování.

Základy popisné statistiky, teorie pravděpodobnosti a matematické statistiky.

Pravidla hodnocení a ukončení předmětu

Během semestru budou studenti pracovat na dvou vlastních projektech zaměřených na i) práci s databázemi ii) zpracování a prezentaci dat (interaktivní dashboad).
Tyto projekty jsou povinné pro udělení zápočtu. Ať už s využitím těchto dílčích projektů nebo nezávisle na nich student zpracuje individuálně finální projekt zaměřený na zpracování dat, jehož téma bude s vyučujícím dopředu zkonzultováno. Zkouška probíhá ústně formou rozpravy nad tímto projektem, jenž bude ohodnocen na stupnici 0 - 100.

Hodnocení podle bodů: výborně (90 až 100 bodů), velmi dobře (80 až 89), dobře (70 až 79 bodů), uspokojivě (60 až 69 bodů), dostatečně (50 až 59 bodů), nevyhovující (0 až 49 bodů).

Účast na cvičeních je povinná. Během semestru jsou tolerovány dvě neomluvené absence. Nahrazení zameškané výuky určí vedoucí cvičení.

Učební cíle

Základní koncepty a nástroje pro manipulaci s daty. Tato témata budou probírána i s ukázkou implementace:

  • databáze (dotazování, indexování)
  • vizualizace
  • základní statistika
  • regresní analýza a strojové učení
  • práce s geografickými daty

Základní literatura

Larsen, R., Marx, M., Introduction to Mathematical Statistics and Its Applications, 6nd ed., 2017. ISBN: 978-01341142178
Sharpe, NR, Veaux, RDD, Velleman.  PF. Business statistics. Pearson, 2017. (EN)

Zařazení předmětu ve studijních plánech

  • Program N-LAN-A magisterský navazující 1 ročník, zimní semestr, povinný

Typ (způsob) výuky

 

Přednáška

26 hod., nepovinná

Vyučující / Lektor

Osnova

Úvod do databází 
Základní dotazy a jednoduché příkazy
Větší instance a indexování databází (výpočetní aspekty vs. velikost databáze)

Projekt 1: vlastní projekt s db
Popisná statistika a základní statistické metody 
Vizualizace, seznámení s různými knihovnami, různé typy grafů
Pokročilejší vizualizace, dashboardy
GIS + python - mapové podklady - vizualizace
Analýzy na mapě
Projekt 2: vlastní dashboard
Lineární regrese a logistická regrese - základní ekonometrie
Lineární regrese II; strojové učení: neuronové sítě
Strojové učení: boosted trees
Shrnutí a připomenutí vědomostí a metod používaných v předcházejících kurzech – pravděpodobnost, náhodná proměnná.

Cvičení s počítačovou podporou

26 hod., povinná

Vyučující / Lektor

Osnova

Úvod do databází
Základní dotazy a jednoduché příkazy
Větší instance a indexování databází (výpočetní aspekty vs. velikost databáze)

Projekt 1: vlastní projekt s db
Popisná statistika a základní statistické metody
Vizualizace, seznámení s různými knihovnami, různé typy grafů
Pokročilejší vizualizace, dashboardy
GIS + python - mapové podklady - vizualizace
Analýzy na mapě
Projekt 2: vlastní dashboard
Lineární regrese a logistická regrese - základní ekonometrie
Lineární regrese II; strojové učení: neuronové sítě
Strojové učení: boosted trees
Shrnutí a připomenutí vědomostí a metod používaných v předcházejících kurzech – pravděpodobnost, náhodná proměnná.