Detail předmětu

Analýza biologických sekvencí

FEKT-MPC-ABSAk. rok: 2023/2024

Předmět pokrývá statistické základy a přehled hlavních metod analýzy biologických sekvencí. Témata zahrnují základy pravděpodobnosti, skryté Markovovy modely a testování více hypotéz. Metody analýzy sekvencí zahrnují zarovnávání, optimální párování pro lokální zarovnávání, optimální párování pro globální zarovnávání a zarovnávání více sekvencí, vyhledávání genů a využití fylogenetických stromů.

Jazyk výuky

čeština

Počet kreditů

6

Vstupní znalosti

Student by měl být schopen vysvětlit základní principy klasické genetiky, měl by znát základní pojmy a zákony molekulární biologie a měl by ovládat základní znalosti z číslicového zpracování signálů. Obecně jsou požadovány znalosti na úrovni bakalářského studia.

Pravidla hodnocení a ukončení předmětu

až 40 bodů ze cvičení (3x test a 1x domácí úkol)
až 60 bodů za písemnou zkoušku
Zkouška je zaměřena na ověření orientace v pojmech pokročilého zpracování biologických sekvencí, schopnosti navrhnout způsob analýzy sekvencí, prakticky provést operace se sekvencemi.
Laboratorní výuka je povinná. Řádně omluvené zameškané hodiny lze nahradit po domluvě s vyučujícím.

Učební cíle

Cílem předmětu je poskytnout znalosti o pokročilých metodách analýzy biologických sekvencí založených na deterministickém i pravděpodobnostním přístupu. Aplikace zahrnují zejména zarovnávání sekvencí, vyhledávání genů a využití fylogenetických stromů.
Absolvent předmětu je schopen:
- popsat základní způsoby počítačového zpracování symbolických sekvencí,
- vysvětlit charakteristiku evoluce DNA a proteinů,
- popsat principy metod konstrukce a analýzy fylogenetických stromů,
- diskutovat výhody a nevýhody jednotlivých metod,
- vysvětlit principy numerické konverze symbolických biologických sekvencí.

Základní literatura

Amjesh, R. Bioinformatics for beginners. LAP LAMBERT Academic Publishing, 2019. ISBN 978-6200262851 (EN)
Durbin, R. Biological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids. Cambridge University Press, 2002. ISBN: 978-0521629713 (EN)
Rosypal, S. Nový přehled biologie. Scientia, Praha 2003. ISBN 80-7183-268-5 (CS)
Srinivasa, K. G. Statistical Modelling and Machine Learning Principles for Bioinformatics Techniques, Tools, and Applications. Springer, 2020. ISBN 978-9811524448 (EN)

Doporučená literatura

Kejnovský, E., Hobza, R. Evoluční genomika, Elportál, Brno: Masarykova univerzita, 2006. ISSN 1802-128X (CS)
Pevzner, P. A. An Introduction to Bioinformatics Algorithms (Computational Molecular Biology. The MIT Press, 2004. ISBN: 978-0262101066 (EN)

Elearning

Zařazení předmětu ve studijních plánech

  • Program MPC-BTB magisterský navazující 1 ročník, letní semestr, povinný

Typ (způsob) výuky

 

Přednáška

26 hod., nepovinná

Vyučující / Lektor

Osnova

1. Genetická variabilita.
2. Modely evoluce sekvencí.
3. Modely evoluce proteinů.
4. Fylogenetické stromy.
5. Konstrukce fylogenetických stromů.
6. Vyhodnocení fylogenetické analýzy.
7. Numerické reprezentace genomických dat.
8. Numerické konverze.
9. Popis struktury proteinů.
10. Identifikace motivů.
11. Algoritmy a optimalizace identifikace motivů.

Cvičení na počítači

26 hod., povinná

Vyučující / Lektor

Osnova

      1. Genetická variabilita
      2. Modely evoluce DNA
      3. Modely evoluce proteinů
      4. Fylogenetické stromy Úvod
      5. Fylogenetické stromy - konstrukce
      6. Vyhodnocení fylogenetické analýzy
      7. Popis struktury proteinů
      8. Srovnáni proteinových struktur
      9. Zápis dat ze sekvenování
      10. Zpracování dat ze sekvenování
      11. Analýza CNV a metylace
      12. Numerické a grafické reprezentace

Projekt

13 hod., povinná

Vyučující / Lektor

Osnova

Samostatné projekty zaměřené na různé varianty z oblasti analýzy biologických sekvencí.

Elearning