Detail předmětu
Parallel Data Processing
FEKT-MPA-PZPAk. rok: 2025/2026
Paralelizace na CPU. Paralelizace na GPU (maticové operace, algoritmy hlubokého učení). Technologie Apache Spark, Hadoop, Kafka, Cassandra. Distribuované výpočty pro operace: transformace dat, agregace, klasifikace, regrese, shlukování dat, četné vzory, optimalizace. Streamování dat – základní operace, stavové operace, monitorování. Další technologie pro distribuované výpočty.
Jazyk výuky
angličtina
Počet kreditů
6
Garant předmětu
Zajišťuje ústav
Pravidla hodnocení a ukončení předmětu
závěrečná zkouška
Vymezení kontrolované výuky a způsob jejího provádění stanoví každoročně aktualizovaná vyhláška garanta předmětu.
Vymezení kontrolované výuky a způsob jejího provádění stanoví každoročně aktualizovaná vyhláška garanta předmětu.
Učební cíle
Cílem kurzu je seznámit studenty s možnostmi paralelizace při zpracování dat s využitím klasických procesorů, grafických procesorů a distribuovaných systémů.
Absolventi jsou schopni návrhu a implementace různých forem paralelních systémů pro řešení problémů při zpracování velkých objemů dat. Naučí se techniky pro paralelizaci programů na CPU a GPU a dále techniky pro distribuované výpočty. Zde budou absolventi ovládat technologie Apache Spark, Kafka, Cassaandra a naučí se provádět distribuované zpracování dat s využitím datových operací: transformace, agregace, klasifikace, regrese, shlukování dat, četné vzory.
Absolventi jsou schopni návrhu a implementace různých forem paralelních systémů pro řešení problémů při zpracování velkých objemů dat. Naučí se techniky pro paralelizaci programů na CPU a GPU a dále techniky pro distribuované výpočty. Zde budou absolventi ovládat technologie Apache Spark, Kafka, Cassaandra a naučí se provádět distribuované zpracování dat s využitím datových operací: transformace, agregace, klasifikace, regrese, shlukování dat, četné vzory.
Základní literatura
Dasgupta, Nataraj. "Practical big data analytics: Hands-on techniques to implement enterprise analytics and machine learning using Hadoop, Spark, NoSQL and R." (2018) (EN)
Doporučená literatura
BARLAS, Gerassimos. Multicore and gpu programming: an integrated approach. ISBN 9780124171374 (EN)
Zařazení předmětu ve studijních plánech
- Program MPAD-ACS magisterský navazující 2 ročník, zimní semestr, povinný
- Program MPA-CAN magisterský navazující 2 ročník, zimní semestr, povinný
- Program MPA-EAK magisterský navazující 0 ročník, zimní semestr, povinně volitelný
- Program MPAD-CAN magisterský navazující 2 ročník, zimní semestr, povinný
- Program MPC-TIT magisterský navazující 0 ročník, zimní semestr, povinně volitelný