Přístupnostní navigace
E-application
Search Search Close
Course detail
FEKT-MPC-PZPAcad. year: 2024/2025
Parallelization using CPU. Parallelization using GPU (matrix operations, deep learning algorithms). Technologies: Apache Spark, Hadoop, Kafka, Cassandra. Distributed computations for operations: data transformation, aggregation, classification, regression, clustering, frequent patterns, optimization. Data streaming – basic operations, state operations, monitoring. Further technologies for distributed computations.
Language of instruction
Number of ECTS credits
Mode of study
Guarantor
Department
Entry knowledge
Rules for evaluation and completion of the course
Aims
Study aids
Prerequisites and corequisites
Basic literature
Recommended reading
Elearning
Classification of course in study plans
specialization AUDM-TECH , 2 year of study, winter semester, compulsory-optional
Lecture
Teacher / Lecturer
Syllabus
1. Úvod do paralelního zpracování dat.
2. Paralelní výpočty na CPU – návrh paralelních programů, vlákna, procesy, synchronizace.
3. Úvod do programování GPU – vlákna, bloky, mřížka, PyCUDA.
4. Paměť GPU – globální, sdílená; rychlost a velikosti.
5. Synchronizace na GPU – atomické operace, warpy.
6. Paralelní vzory na GPU – warp shuffles, asynchronní spuštění funkcí, paralelní redukce.
7. Operace s maticemi a “streams” na GPU – násobení matic, využití více GPU.
8. Úvod do Spark – Jobs, Stages, Tasks, DAG atd.
9. Pokročilé operace ve Spark – sdílené proměnné, partitioning, webové rozhraní, DataFrames.
10. Strojové učení ve Spark – statistika, extrakce příznaků, klasifikace, shluková analýza apod.
11. Streamování ve Spark – DStreams, SQL operace, MLlib.
12. Další paralelní technologie – Apache Kafka, Nvidia Jetson, TPU.
Exercise in computer lab
Cvičení na počítači jsou vedeny v jazyce Python a s využitím prostředí Google Colab.
Project