Detail předmětu

Analýza biologických sekvencí

FEKT-MPC-ABSAk. rok: 2022/2023

Předmět pokrývá statistické základy a přehled hlavních metod analýzy biologických sekvencí. Témata zahrnují základy pravděpodobnosti, skryté Markovovy modely a testování více hypotéz. Metody analýzy sekvencí zahrnují zarovnávání, optimální párování pro lokální zarovnávání, optimální párování pro globální zarovnávání a zarovnávání více sekvencí, vyhledávání genů a využití fylogenetických stromů.

Jazyk výuky

čeština

Počet kreditů

6

Výsledky učení předmětu

Absolvent předmětu je schopen:
- popsat základní způsoby počítačového zpracování symbolických sekvencí,
- vysvětlit charakteristiku evoluce DNA a proteinů,
- popsat principy metod konstrukce a analýzy fylogenetických stromů,
- diskutovat výhody a nevýhody jednotlivých metod,
- vysvětlit principy numerické konverze symbolických biologických sekvencí.

Prerekvizity

Student by měl být schopen vysvětlit základní principy klasické genetiky, měl by znát základní pojmy a zákony molekulární biologie a měl by ovládat základní znalosti z číslicového zpracování signálů. Obecně jsou požadovány znalosti na úrovni bakalářského studia.

Plánované vzdělávací činnosti a výukové metody

Metody vyučování zahrnují přednášky a laboratorní cvičení na počítači. Předmět využívá e-learning (Moodle). Student odevzdává projekty podle pokynů vyučujících.

Způsob a kritéria hodnocení

až 40 bodů ze cvičení (3x test a 1x domácí úkol)
až 60 bodů za písemnou zkoušku
Zkouška je zaměřena na ověření orientace v pojmech pokročilého zpracování biologických sekvencí, schopnosti navrhnout způsob analýzy sekvencí, prakticky provést operace se sekvencemi.

Osnovy výuky

1. Genetická variabilita.
2. Modely evoluce sekvencí.
3. Modely evoluce proteinů.
4. Fylogenetické stromy.
5. Konstrukce fylogenetických stromů.
6. Vyhodnocení fylogenetické analýzy.
7. Numerické reprezentace genomických dat.
8. Numerické konverze.
9. Popis struktury proteinů.
10. Zpracování NGS dat.
11. Metagenomika.

Učební cíle

Cílem předmětu je poskytnout znalosti o pokročilých metodách analýzy biologických sekvencí založených na deterministickém i pravděpodobnostním přístupu. Aplikace zahrnují zejména zarovnávání sekvencí, vyhledávání genů a využití fylogenetických stromů.

Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky

Laboratorní výuka je povinná. Řádně omluvené zameškané hodiny lze nahradit po domluvě s vyučujícím.

Základní literatura

Amjesh, R. Bioinformatics for beginners. LAP LAMBERT Academic Publishing, 2019. ISBN 978-6200262851 (EN)
Durbin, R. Biological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids. Cambridge University Press, 2002. ISBN: 978-0521629713 (EN)
Rosypal, S. Nový přehled biologie. Scientia, Praha 2003. ISBN 80-7183-268-5 (CS)
Srinivasa, K. G. Statistical Modelling and Machine Learning Principles for Bioinformatics Techniques, Tools, and Applications. Springer, 2020. ISBN 978-9811524448 (EN)

Doporučená literatura

Kejnovský, E., Hobza, R. Evoluční genomika, Elportál, Brno: Masarykova univerzita, 2006. ISSN 1802-128X (CS)
Pevzner, P. A. An Introduction to Bioinformatics Algorithms (Computational Molecular Biology. The MIT Press, 2004. ISBN: 978-0262101066 (EN)

Elearning

Zařazení předmětu ve studijních plánech

  • Program MPC-BTB magisterský navazující 1 ročník, letní semestr, povinný

Typ (způsob) výuky

 

Přednáška

26 hod., nepovinná

Vyučující / Lektor

Osnova

1. Genetická variabilita.
2. Modely evoluce sekvencí.
3. Modely evoluce proteinů.
4. Fylogenetické stromy.
5. Konstrukce fylogenetických stromů.
6. Vyhodnocení fylogenetické analýzy.
7. Numerické reprezentace genomických dat.
8. Numerické konverze.
9. Popis struktury proteinů.
10. Identifikace motivů.
11. Algoritmy a optimalizace identifikace motivů.

Cvičení na počítači

26 hod., povinná

Vyučující / Lektor

Osnova

1. Opakování z bioinformatiky.
2. Modely evoluce v DNA sekvenci.
3. Modely evoluce v sekvencích DNA a proteinů.
4. Fylogenetické stromy v Matlabu.
5. Konstrukce stromů metodou Neighbor-Joining.
6. Robustnost fylogenetických stromů.
7. Numerické a grafické reprezentace DNA.
8. Numerické reprezentace aminokyselin.
9. Fázová analýza.
10. Popis struktury proteinu.

Projekt

13 hod., povinná

Vyučující / Lektor

Osnova

Samostatné projekty zaměřené na různé varianty z oblasti analýzy biologických sekvencí.

Elearning