Detail předmětu

Statistická analýza dat

CESA-SPSTAk. rok: 2021/2022

Předmět je věnován statistické analýze dat, včetně jejich teoretických (základní principy statistických odhadů a testů) a praktických aspektů (plánování experimentů, provádění jednovýběrových a dvouvýběrových testů, korelační a regresní analýzy, analýzy rozptylu). Teoretické znalosti se průběžně uplatňuji v rámci řešení praktických příkladů s pomocí běžně používaných softwarových nástrojů. Kurz připravuje posluchače k samostatnému využití statistických metod pro analýzu dat ve vlastní vědecké či rutinní práci.

Jazyk výuky

čeština

Počet kreditů

5

Výsledky učení předmětu

Posluchač získá základní znalosti a dovednosti z oblasti statistické analýzy dat. Bude schopen je aplikovat v praxi při plánování studií, výběru vhodných statistických metod a interpretaci jejich výsledků.
Písemnou zkouškou se ověřuje, že absolvent předmětu je schopen:
- vysvětlit základní pojmy v oblasti statistické analýzy dat a jejich vztahy, popsat základní metody v této oblasti,
- vybrat a použít vhodné nástroje pro daný problém z této oblasti, interpretovat dosažené výsledky,
- graficky prezentovat statistická data, navrhnout studii zahrnující sběr a následnou analýzu dat.

Prerekvizity

Jsou požadovány znalosti na úrovni středoškolského studia matematiky, práce s PC, základy práce s MS Excel a Matlab.

Plánované vzdělávací činnosti a výukové metody

Metody vyučování zahrnují přednášky a cvičení na počítači. Předmět využívá e-learning. Student absolvuje dvě písemky.

Způsob a kritéria hodnocení

Písemka ve cvičení (max. 40 bodů):

  • Zaměření na témata probraná ve cvičeních
  • Bez možnosti opravy či náhradního termínu
  • Ve výjimečných případech (nemoc apod.) rozhodne o řešení garant předmětu

Závěrečná zkouška (max. 60 bodů):

  • kombinovaná forma (písemná i ústní)
  • celkem dvě části, každá za max. 30 bodů

Podmínky pro udělení zápočtu a připuštění k závěrečné zkoušce

  • získání nejméně 20 bodů za písemku
  • maximálně dvě omluvené neúčastí na cvičeních (ve výjimečných případech rozhodne o řešení garant předmětu)

Podmínky pro úspěšné absolvování předmětu

  • získání zápočtu
  • získání nejméně 15 bodů z každé ze dvou částí zkoušky
  • získání celkem (tj. z písemky a zkoušky) alespoň 50 bodů

 


Osnovy výuky

Předmět je věnován statistické analýze dat, včetně jejich teoretických (základní principy statistických odhadů a testů) a praktických aspektů (plánování experimentů, provádění jednovýběrových a dvouvýběrových testů, korelační a regresní analýzy, analýzy rozptylu). Teoretické znalosti se průběžně uplatňuji v rámci řešení praktických příkladů s pomocí běžně používaných softwarových nástrojů. Kurz připravuje posluchače k samostatnému využití statistických metod pro analýzu dat ve vlastní vědecké či rutinní práci.

1. Úvod do statistiky. Typy statistických úloh (odhady parametrů, testování hypotéz, predikce, klasifikace)
2. Statistika a pravděpodobnost. Bayesův teorém. Sensitivita, specificita, prediktivní hodnoty. ROC křivka
3. Spojitá, ordinální a nominální data. Základní a výběrový soubor. Popisné charakteristiky souboru. Grafická reprezentace dat. Identifikace odlehlých hodnot
4. Náhodná veličina. Rozložení diskrétních a spojitých náhodných veličin. Kontrola typu rozdělení pravděpodobnosti. Normální rozdělení pravděpodobnosti. Transformace náhodné veličiny a její význam pro zpracování dat
5. Odhady charakteristik náhodných veličin. Centrální limitní věta, interval spolehlivosti odhadu a jeho interpretace. Úvod do testování hypotéz. P-hodnota a její interpretace. Chyba I. a II. druhu, sila testu, velikost výběru
6. Jednovýběrové testy. Párová a nepárová data. Parametrické a neparametrické metody
7. Dvouvýběrové testy. Párová a nepárová data. Parametrické a neparametrické metody
8. Vícevýběrové testy I. Analýza rozptylu (ANOVA). Cíle a předpoklady. Zobecnění
9. Vícevýběrové testy II. Párová a nepárová data. Parametrické a neparametrické metody
10. Analýza binárních a ordinálních dat. Kontingenční tabulka. Jednovýběrový binomický test. Vícevýběrové testy: Fisherův exaktní test a Chi-kvadrát test pro nepárová data; McNemarův test pro párová data
11. Korelační analýza. Parametrická a pořadová korelace (kovariance, korelační koeficienty, koeficienty podobnosti). Korelační a kovarianční matice
12. Regresní analýza. Lineární regrese. Metoda nejmenších čtverců pro odhad koeficientů regresních koeficientů. Analýza reziduí regresních modelů
13. Úvod do plánování experimentů. Plánování velikosti souboru. Randomizační techniky. Zaslepení studie. Přehled experimentálních plánů

Učební cíle

Cílem předmětu je poskytnout studentům znalosti ke sběru dat a prezentovat základní metody statistické analýzy dat, včetně jejich výpočetní podstaty, předpokladů a možnosti aplikace při řešení reálných úloh z oblasti biologických a sportovních věd.

Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky

Vymezení kontrolované výuky a způsob jejího provádění stanoví každoročně aktualizovaná vyhláška garanta předmětu (viz Rozvrhové jednotky).
V zásadě:
- povinné počítačové cvičení (zmeškaná laboratorní cvičení musí být řádně omluvená a lze je nahradit po domluvě s vyučujícím)
- nepovinná přednáška

Základní literatura

BAŠTINEC, J., FAJMON, B., KOLÁČEK, J.: Pravděpodobnost, statistika a operační výzkum. Skripta VUT, Brno 2014. (CS)
MELOUN, M., MILITKÝ, J.: Statistická analýza experimentálních dat. Academia, Praha 2004, ISBN 80-200-1254-0. (CS)

Doporučená literatura

BUDÍKOVÁ, M., KRÁLOVÁ, M., MAROŠ, B.: Průvodce základními statistickými metodami. Grada Publishing, Praha 2010, ISBN 978-80-247-3243-5. (CS)
McDONALD, J.H.: Handbook of biological statistics. 3rd ed. Sparky House Publishing, Baltimore, Maryland 2015. (CS)

Elearning

Zařazení předmětu ve studijních plánech

  • Program BPC-STC bakalářský 3 ročník, letní semestr, povinný

Typ (způsob) výuky

 

Přednáška

24 hod., nepovinná

Vyučující / Lektor

Cvičení s počítačovou podporou

24 hod., povinná

Vyučující / Lektor

Elearning