Detail předmětu
Multidimensional Analysis of Biomedical Data
FEKT-MPA-VMMAk. rok: 2025/2026
Předmět je orientován na běžně používané metody z oblasti analýzy vícerozměrných dat: shluková analýza, metoda hlavních komponent, t-SNE, UMAP, apod. Jsou probíraný jak teoretické (základní principy jednotlivých metod), tak praktické (aplikace při zobrazování a analýze vícerozměrných dat) aspekty. Teorie je probíraná v přímé spojitosti s praktickými příklady. Veškeré výpočetní techniky jsou procvičovány s pomocí prostředí Python. Kurz připravuje posluchače k samostatnému využití daných metod pro analýzu dat ve vlastní vědecké či rutinní práci.
Jazyk výuky
Počet kreditů
Garant předmětu
Zajišťuje ústav
Vstupní znalosti
Student by měl mít znalosti z oblasti základní statistické analýzy dat a lineární algebry. V laboratorní výuce je předpokládána znalost Python.
Pravidla hodnocení a ukončení předmětu
Bodové hodnocení předmětu:
1) Týmový projekt (max. 20 bodů):
• Zpracování originálního řešení týmového projektu a jeho obhajoba na konci semestru (podle pokynů)
Pozn.:
- Hodnoceno bude splnění zadání a kvalita prezentace výsledků všemi členy týmu
- Plagiátorství bude mít za následek neudělení zápočtu
- Povinná alespoň jedna konzultace týmu s konzultantem!
2) Závěrečná zkouška (max. 80 bodů):
• ústní forma
• celkem dvě části, každá za max. 40 bodů
Podmínky pro udělení zápočtu a připuštění k závěrečné zkoušce:
• získání nenulového počtu bodů za týmový projekt
• maximálně dvě omluvené neúčastí na cvičeních (ve výjimečných případech rozhodne o řešení garant předmětu)
Podmínky pro úspěšné absolvování předmětu:
• získání zápočtu
• získání nejméně 20 bodů z každé ze dvou částí zkoušky
• získání celkem (tj. z projektu a zkoušky) alespoň 50 bodů
Učební cíle
Cílem předmětu je poskytnout studentům znalosti z oblasti vícerozměrné analýzy dat a prezentovat jim možnosti využiti vybraných postupů při zpracování a analýze biomedicínských dat.
Posluchač získá základní znalosti a dovednosti z oblasti využití metod vícerozměrné analýzy. Bude schopen aplikovat nejčastěji používané metody v praxi za účelem zpracování a analýzy dat.
Zkouškou se ověřuje, že absolvent předmětu je schopen:
- vysvětlit základní pojmy z oblasti vícerozměrné analýzy,
- popsat základní metody v této oblasti, diskutovat výhody a nevýhody jednotlivých metod,
- vybrat a použít vhodné nástroje pro daný problém z této oblasti,
- vyhodnotit kvalitu dosažených výsledků a prezentovat je ve vhodné formě,
- interpretovat dosažené výsledky.
Základní literatura
J.H. McDonald: Handbook of Biological Statistics, Sparky House Publishing, 2008 (CS)
Doporučená literatura
Zařazení předmětu ve studijních plánech
Typ (způsob) výuky
Přednáška
Vyučující / Lektor
Osnova
1. Úvod do vícerozměrné analýzy biologických dat. Cíle vícerozměrné analýzy. Klasifikace metod.
2. Základy lineární algebry - opakování.
3. Vícerozměrné statistické rozdělení a testy.
4. Metody předzpracování dat. Typy transformace a standardizace. Problém chybějících dat.
5. Vztah mezi proměnnými ve vícerozměrném prostoru. Metriky podobnosti a vzdálenosti. Regrese, korelace, kovariance.
6. Shluková analýza biologických dat. Hierarchické a nehierarchické metody. Stanovení optimálního počtu shluků. Validace výsledků shlukování.
7. Ordinační analýza. Analýza hlavních komponent (PCA). Principy rozkladu matice.
8. Duální formy a jádra - kernel PCA.
9. Ordinační analýza. Faktorová analýza. Rotace faktorů.
10. Nelineární metody redukce dimenzionality dat. Metoda t-SNE.
11. Nelineární metody redukce dimenzionality dat. Metoda UMAP.
12. Příklady využití vícerozměrné analýzy biologických dat: vizualizace, selekce a extrakce příznaků, analýza vztahů mezi proměnnými.
Cvičení na počítači
Vyučující / Lektor
Osnova
1. Základy lineární algebry - opakování.
2. Průzkumová analýza dat: vizualizace, statistická deskriptivní analýza.
3. Průzkumová analýza dat: zpracování dat.
4. Vztahy ve vícerozměrném prostoru: korelační analýza.
5. Vztahy ve vícerozměrném prostoru: regresní analýza, logistická regrese.
6. Vztahy ve vícerozměrném prostoru: MANOVA.
7. Ordinační analýza: PCA.
8. Ordinační analýza: kernel PCA.
9. Shluková analýza: k-means, UPGMA.
10. Shluková analýza: hodnocení kvality shluků.
11. Vizualizace vícerozměrných dat I: t-SNE.
12. Vizualizace vícerozměrných dat II: UMAP.