Detail předmětu
Architektury výpočetních systémů
FIT-AVSAk. rok: 2024/2025
Předmět pokrývá architekturu současných výpočetních systémů složených z univerzálních i specializovaných procesorů a jejich paměťové subsystémy. Paralelismus na úrovni instrukcí je studován na skalárních a superskalárních procesorech. Dále jsou probrány procesory s vláknovým paralelismem. Datový paralelismus je ilustrován na SIMD instrukcích a na grafických procesorech. Následuje výklad programování víceprocesorových systémů se sdílenou pamětí v prostředí OpenMP a popis nejrozšířenějších vícejádrových multiprocesorů i pokročilých systémů NUMA. V závěru se probírá generická architektura grafických karet a základní techniky akcelerace výpočtů na GPU pomocí OpenMP. Jsou vysvětleny i techniky použité při nízkopříkonových procesorů a aplikací.
Jazyk výuky
Počet kreditů
Garant předmětu
Zajišťuje ústav
Vstupní znalosti
Architektura počítače typu von Neumann, hierarchická organizace paměťového systému, programování v jazyce symbolických instrukcí a jazyce C/C++, činnost a funkce kompilátoru.
Pravidla hodnocení a ukončení předmětu
- Vyhodnocení dvou projektů v celkovém rozsahu 14 hodin a půlsemestrální písemky.
- Zameškaná cvičení je možné nahradit v alternativní termínu.
- Pro udělení zápočtu je nutné získat min 20b ze 40b a minimálně 1b z každého projektu.
Učební cíle
Seznámit se s architekturou moderních výpočetních systémů založených na vícejádrových procesorech architektury x86, RISC-V nebo ARM v konfiguracích se sdílenou (UMA) i distribuovanou sdílenou (NUMA) pamětí, často doplněných o akcelerátor ve formě GPU. Pochopit hardwarové aspekty výpočetních systémů, které mají vliv na výkon dané aplikace a příkon systému. Umět posoudit možnosti konkrétní architektury a predikovat výkonnost aplikací. Ujasnit si úlohu překladače a jeho spolupráci s procesorem. Získat schopnost orientovat se v nabídce jednotlivých komponent výpočetních systémů, dovést je hodnotit a porovnávat.
Přehled architektur současných výpočetních systémů, jejich možností a budoucích trendů. Schopnost vyhodnotit efektivitu softwarových aplikací na daném výpočetním systému, identifikovat výkonnostní problémy a navrhnout jejich nápravu. Praktické zkušenosti s prací na superpočítačích Barbora a Karolina.
Pochopení důsledků hardwarových omezení na efektivitu softwarových řešení.
Základní literatura
Hennessy, J.L., Patterson, D.A.: Computer Architecture - A Quantitative Approach. 5. vydání, Morgan Kaufman Publishers, Inc., 2012, 1136 s., ISBN 1-55860-596-7. (EN)
van der Pas, R., Stotzer, E., and Terboven, T.: Using OpenMP-The Next Step, MIT Press Ltd, ISBN 9780262534789, 2017. (EN)
Doporučená literatura
Aktuální PPT prezentace přednášek v Elearningu.
Baer, J.L.: Microprocessor Architecture. Cambridge University Press, 2010, 367 s., ISBN 978-0-521-76992-1. info.
Hennessy, J.L., Patterson, D.A.: Computer Architecture - A Quantitative Approach. 5. vydání, Morgan Kaufman Publishers, Inc., 2012, 1136 s., ISBN 1-55860-596-7. download.
Materiály ke kurzu Computer Science 152: Computer Architecture and Engineering. http://inst.eecs.berkeley.edu/~cs152/sp13/
van der Pas, R., Stotzer, E., and Terboven, T.: Using OpenMP-The Next Step, MIT Press Ltd, ISBN 9780262534789, 2017. info.
Elearning
Zařazení předmětu ve studijních plánech
- Program MITAI magisterský navazující
specializace NGRI , 0 ročník, zimní semestr, povinný
specializace NADE , 1 ročník, zimní semestr, povinný
specializace NISD , 0 ročník, zimní semestr, povinný
specializace NMAT , 0 ročník, zimní semestr, povinný
specializace NSEC , 0 ročník, zimní semestr, povinný
specializace NISY do 2020/21 , 0 ročník, zimní semestr, povinný
specializace NNET , 1 ročník, zimní semestr, povinný
specializace NMAL , 1 ročník, zimní semestr, povinný
specializace NCPS , 1 ročník, zimní semestr, povinný
specializace NHPC , 1 ročník, zimní semestr, povinný
specializace NVER , 0 ročník, zimní semestr, povinný
specializace NIDE , 1 ročník, zimní semestr, povinný
specializace NISY , 0 ročník, zimní semestr, povinný
specializace NEMB do 2023/24 , 1 ročník, zimní semestr, povinný
specializace NSPE , 1 ročník, zimní semestr, povinný
specializace NEMB , 1 ročník, zimní semestr, povinný
specializace NBIO , 1 ročník, zimní semestr, povinný
specializace NSEN , 1 ročník, zimní semestr, povinný
specializace NVIZ , 1 ročník, zimní semestr, povinný
Typ (způsob) výuky
Přednáška
Vyučující / Lektor
Osnova
- Skalární procesory, zřetězené zpracování instrukcí, asistence kompilátoru.
- Superskalární procesory, dynamické plánování instrukcí.
- Optimalizace toku dat v hierarchii pamětí cache.
- Predikce skoků, optimalizace načítání instrukcí a dat.
- Procesory s podporou datového paralelismu a vektorizace.
- Procesory s podporou vláken a vícejádrové procesory.
- Paralelizace a vektorizace smyček.
- Funkční paralelismus a akcelerace rekurzivních algoritmů.
- Synchronizace na systémech se sdílenou pamětí.
- Algoritmy koherence pamětí cache.
- Architektury s distribuovanou sdílenou pamětí.
- Architektura a programování grafických karet.
- Nízkopříkonové procesory a techniky pro snižování příkonu.
Cvičení na počítači
Vyučující / Lektor
Osnova
- Měření výkonnosti sekvenčních kódů, představení Intel Tools (4. týden).
- Efektivní využití cache, přehazování a rozbalování smyček (5. týden).
- Vektorizace kódu pomocí OpenMP (6. týden).
- Paralelizace smyček pomocí OpenMP (9. týden).
- Funkční paralelizace pomocí OpenMP tasků (10. týden).
- Sekce a vzájemné vyloučení pomocí OpenMP (11. týden).
Projekt
Vyučující / Lektor
Osnova
- Optimalizace jednovláknové aplikace pomocí pomocí cache blockingu, vektoriace a restrukturalizace kódu.
- Vývoj paralelní aplikace pomocí OpenMP.
Elearning