Detail předmětu
Statistická analýza dat
CESA-SPSTAk. rok: 2021/2022
Předmět je věnován statistické analýze dat, včetně jejich teoretických (základní principy statistických odhadů a testů) a praktických aspektů (plánování experimentů, provádění jednovýběrových a dvouvýběrových testů, korelační a regresní analýzy, analýzy rozptylu). Teoretické znalosti se průběžně uplatňuji v rámci řešení praktických příkladů s pomocí běžně používaných softwarových nástrojů. Kurz připravuje posluchače k samostatnému využití statistických metod pro analýzu dat ve vlastní vědecké či rutinní práci.
Jazyk výuky
Počet kreditů
Garant předmětu
Zajišťuje ústav
Výsledky učení předmětu
Písemnou zkouškou se ověřuje, že absolvent předmětu je schopen:
- vysvětlit základní pojmy v oblasti statistické analýzy dat a jejich vztahy, popsat základní metody v této oblasti,
- vybrat a použít vhodné nástroje pro daný problém z této oblasti, interpretovat dosažené výsledky,
- graficky prezentovat statistická data, navrhnout studii zahrnující sběr a následnou analýzu dat.
Prerekvizity
Plánované vzdělávací činnosti a výukové metody
Způsob a kritéria hodnocení
Písemka ve cvičení (max. 40 bodů):
- Zaměření na témata probraná ve cvičeních
- Bez možnosti opravy či náhradního termínu
- Ve výjimečných případech (nemoc apod.) rozhodne o řešení garant předmětu
Závěrečná zkouška (max. 60 bodů):
- kombinovaná forma (písemná i ústní)
- celkem dvě části, každá za max. 30 bodů
Podmínky pro udělení zápočtu a připuštění k závěrečné zkoušce
- získání nejméně 20 bodů za písemku
- maximálně dvě omluvené neúčastí na cvičeních (ve výjimečných případech rozhodne o řešení garant předmětu)
Podmínky pro úspěšné absolvování předmětu
- získání zápočtu
- získání nejméně 15 bodů z každé ze dvou částí zkoušky
- získání celkem (tj. z písemky a zkoušky) alespoň 50 bodů
Osnovy výuky
1. Úvod do statistiky. Typy statistických úloh (odhady parametrů, testování hypotéz, predikce, klasifikace)
2. Statistika a pravděpodobnost. Bayesův teorém. Sensitivita, specificita, prediktivní hodnoty. ROC křivka
3. Spojitá, ordinální a nominální data. Základní a výběrový soubor. Popisné charakteristiky souboru. Grafická reprezentace dat. Identifikace odlehlých hodnot
4. Náhodná veličina. Rozložení diskrétních a spojitých náhodných veličin. Kontrola typu rozdělení pravděpodobnosti. Normální rozdělení pravděpodobnosti. Transformace náhodné veličiny a její význam pro zpracování dat
5. Odhady charakteristik náhodných veličin. Centrální limitní věta, interval spolehlivosti odhadu a jeho interpretace. Úvod do testování hypotéz. P-hodnota a její interpretace. Chyba I. a II. druhu, sila testu, velikost výběru
6. Jednovýběrové testy. Párová a nepárová data. Parametrické a neparametrické metody
7. Dvouvýběrové testy. Párová a nepárová data. Parametrické a neparametrické metody
8. Vícevýběrové testy I. Analýza rozptylu (ANOVA). Cíle a předpoklady. Zobecnění
9. Vícevýběrové testy II. Párová a nepárová data. Parametrické a neparametrické metody
10. Analýza binárních a ordinálních dat. Kontingenční tabulka. Jednovýběrový binomický test. Vícevýběrové testy: Fisherův exaktní test a Chi-kvadrát test pro nepárová data; McNemarův test pro párová data
11. Korelační analýza. Parametrická a pořadová korelace (kovariance, korelační koeficienty, koeficienty podobnosti). Korelační a kovarianční matice
12. Regresní analýza. Lineární regrese. Metoda nejmenších čtverců pro odhad koeficientů regresních koeficientů. Analýza reziduí regresních modelů
13. Úvod do plánování experimentů. Plánování velikosti souboru. Randomizační techniky. Zaslepení studie. Přehled experimentálních plánů
Učební cíle
Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky
V zásadě:
- povinné počítačové cvičení (zmeškaná laboratorní cvičení musí být řádně omluvená a lze je nahradit po domluvě s vyučujícím)
- nepovinná přednáška
Základní literatura
MELOUN, M., MILITKÝ, J.: Statistická analýza experimentálních dat. Academia, Praha 2004, ISBN 80-200-1254-0. (CS)
Doporučená literatura
McDONALD, J.H.: Handbook of biological statistics. 3rd ed. Sparky House Publishing, Baltimore, Maryland 2015. (CS)
Elearning
Zařazení předmětu ve studijních plánech
- Program BPC-STC bakalářský 3 ročník, letní semestr, povinný
Typ (způsob) výuky
Cvičení s počítačovou podporou
Vyučující / Lektor
Elearning