Detail předmětu

Pravděpodobnost, statistika a analýza dat: úvodní kurz

FSI-S1D-AAk. rok: 2024/2025

Shrnutí a rozšíření základních pojmů z teorie pravděpodobnost a matematické statistiky. Metody odhadů parametrů a jejich vlastnosti. Analýza rozptylu včetně post-hoc analýzy. Testy o rozdělení, testy dobré shody, regresní analýza, diagnostika regresních modelů, neparametrické metody a analýza kategoriálních dat.

Jazyk výuky

angličtina

Počet kreditů

6

Zajišťuje ústav

Vstupní znalosti

Základy diferenciálního a integrálního počtu.

Základy popisné statistiky, teorie pravděpodobnosti a matematické statistiky.

Pravidla hodnocení a ukončení předmětu

Během semestru se budou psát dva testy - v 5. a 10 týdnu. Přesný termín upřesní vyučující. Trvání testu je 60 minut. Ohodnocení každého testu je 0 - 10 bodů.

Projekt je hodnocen: 0-10 bodů.

Zkouška probíhá písemně a ústně. Jsou voleny příklady a otázky ze 4 předem stanovených okruhů (25+25+25+25 bodů). V každém okruhu je pro úspěšné složení zkoušky požadována dostatečná znalost základních pojmů a jejich vlastností. Hodnocení podle bodů: výborně (90 až 100 bodů), velmi dobře (80 až 89), dobře (70 až 79 bodů), uspokojivě (60 až 69 bodů), dostatečně (50 až 59 bodů), nevyhovující (0 až 49 bodů).


Účast na přednáškách v tomto předmětu není kontrolována.
Účast na cvičeních je povinná. Během semestru jsou tolerovány dvě neomluvené absence. Nahrazení zameškané výuky určí vedoucí cvičení.

Učební cíle

Seznámení studentů s dalšími pojmy, metodami a postupy teorie pravděpodobnosti, popisné a matematické statistiky. Navázat na výuku pravděpodobnosti a statistiky v předcházejících kurzech. Formování stochastického způsobu myšlení pro tvorbu matematických modelů s důrazem na aplikovatelnost na datech.


Studenti si rozšíří znalosti z pravděpodobnosti a statistiky a to zejména v oblastech:

  • odhadech parametrů zvoleného rozdělení
  • současné testování více parametrů
  • testování statistických hypotéz o rozdělení
  • korelační analýzy
  • regresní analýzy včetně tvorby regresních modelů
  • tvorby odhadů parametrů
  • Bayesovské statistiky
  • neparametrických metod

Základní literatura

Dobson, A.J., Barnett, A.G. An Introduction to Generalized Linear Models. 4th ed. Chapman & Hall.,2002, ISBN: 978-1138741515 (EN)
Hogg, V.R., McKean J.W. and Craig A.T. Introduction to Mathematical Statistics. Seventh Edition, 2012. Macmillan Publishing Co., INC. New York. ISBN-13: 978-0321795434 (EN)
Casella, G., Berger, R.L. Statistical Inference. 2nd ed., 2001. ISBN: 978-0534243128 (EN)
Larsen, R., Marx, M., Introduction to Mathematical Statistics and Its Applications, 6nd ed., 2017. ISBN: 978-01341142178 (EN)

Doporučená literatura

Montgomery, D, C., Runger G.C. Applied Statistics and Probability for Engineers, 7th Edition, 2018, ISBN: 978-1-119-40036-3 (EN)
ANDĚL, Jiří. Základy matematické statistiky. 3., opr. vyd. Praha: Matfyzpress, 2011. ISBN 978-80-7378-001-2. (CS)

Zařazení předmětu ve studijních plánech

  • Program N-LAN-A magisterský navazující 1 ročník, zimní semestr, povinně volitelný

  • Program C-AKR-P celoživotní vzdělávání v akr. stud. programu

    specializace CZS , 1 ročník, zimní semestr, volitelný

Typ (způsob) výuky

 

Přednáška

26 hod., nepovinná

Vyučující / Lektor

Osnova

  1. Shrnutí a připomenutí vědomostí a metod používaných v předcházejících kurzech – pravděpodobnost, náhodná proměnná.
  2. Shrnutí a připomenutí vědomostí a metod používaných v předcházejících kurzech –náhodný vektor, matematická statistika. Nastínění dalších oblastí z pravděpodobnosti a statistiky, které budou probrány.
  3. Rozšíření testů hypotéz pro binomické a normální rozdělení.
  4. Analýza rozptylu (jednoduché třídění, dvojné třídění bez interakcí a s interakcemi). Mnohonásobné porovnávání (Scheffého a Tukeyho metody).
  5. Korelační analýza
  6. Regresní analýza – část 1: lineární regresní model.
  7. Regresní analýza – část 2: nelineární regresní model. Diagnostika.
  8. Test dobré shody a další testy o rozdělení.
  9. Odhad parametrů s pomocí metody momentů a metody maximální věrohodnosti.
  10. Bayesovský přístup a konstrukce Bayesovských odhadů.
  11. Neparametrické metody testování statistických hypotéz – část 1.
  12. Neparametrické metody testování statistických hypotéz – část 2.
  13. Analýza kategoriálních dat. Kontingenční tabulky. Test nezávislosti. Čtyřpolní tabulky. Fisherův exaktní test.

Cvičení s počítačovou podporou

26 hod., povinná

Vyučující / Lektor

Osnova

  1. Připomenutí příkladů probraných v předcházejících kurzech - pravděpodobnost, náhodná proměnná.
  2. Připomenutí příkladů probraných v předcházejících kurzech - náhodný vektor, matematická statistika.
  3. Testy hypotéz pro binomické a normální rozdělení.
  4. Zadání projektu, analýza rozptylu, post-hoc analýza.
  5. Korelační analýza
  6. Regresní analýza – lineární modely.
  7. Regresní analýza – nelineární modely.
  8. Testy o rozdělení, testy dobré shody.
  9. Metoda momentů a metoda maximální věrohodnosti.
  10. Bayesovské odhady.
  11. Neparametrické metody testování statistických hypotéz – část 1.
  12. Neparametrické metody testování statistických hypotéz – část 2.
  13. Analýza kategoriálních dat. Kontingenční tabulky. Čtyřpolní tabulky.