Detail předmětu

Programování v bioinformatice

FEKT-FPRGAk. rok: 2017/2018

Předmět je zaměřen na programování v oblasti bionformatiky. Zaměřuje se na seznámení s různými typy programů a konkrétními algoritmy používaných pro analýzu sekvencí DNA a proteinů.

Jazyk výuky

čeština

Počet kreditů

6

Výsledky učení předmětu

Student je schopen:
- řešit algoritmy iteračně i rekurzivně
- vyhodnotit náročnost algoritmů
- realizovat algoritmy pro vyhledávání (hrubou silou, Greedyho algoritmus)
- realizovat algoritmy pro zarovnávání sekvencí (lokální, globální, zpětné trasování)
- realizovat algoritmy pro shlukovou analýzu
- realizovat algoritmy pro učení skrytých markovových modelů a pro jejich použití

Prerekvizity

Jsou požadovány znalosti na úrovni bakalářského studia.

Plánované vzdělávací činnosti a výukové metody

Metody vyučování závisejí na způsobu výuky a jsou popsány článkem 7 Studijního a zkušebního řádu VUT.

Způsob a kritéria hodnocení

Studenti musí získat minimálně 50 bodů ze 100 bodů v dílčích aktivitách:
1. test: základní principy algoritmů (min 15 body, max 30 bodů)
2. test: implementace algoritmů (min 15 body, max 30 bodů)
3. závěrečný písemný test: (min 20 bodů, max 40 bodů).
Dílčí aktivity mají prověřit schopnosti studenta realizovat algoritmy v programovém prostředí Matlab pro analýzu genomických dat.

Osnovy výuky

1. Základy algoritmizace úloh a náročnost algoritmů.
2. Typy algoritmů, rekurze a iterace.
3. Regulární výrazy.
4. Třídící algoritmy (greedy algoritmy).
5. Algoritmy pro restrikční mapování (exhaustive search).
6. Vyhledávání motivů (branch and bound algoritmy).
7. Dynamické programování s rekurzí.
8. Algoritmy pro de novo skládání genomu.
9. Markovovy modely v bioinformatice.
10. Sufixové stromy.

Učební cíle

Cílem předmětu je seznámení a osvojení základních algoritmů pro analýzu sekvencí DNA a proteinů a jejich podrobný rozbor. Studenti jsou vedeni k samostatnému programování probíraných algoritmů v programovacím prostředí R či Matlab.

Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky

Počítačová cvičení jsou povinná, řádně omluvené zmeškané cvičení lze po domluvě s vyučujícím nahradit individuálně.

Základní literatura

Chao K.-M., Zhang L.: Sequence Comparison. Springer-Verlag, 2009 (EN)
Jones N.C., Pevzner P.A: An Introduction to Bioinformatics Algorithms. The MIT Press, 2004 (EN)
Moorhouse M, Barry P: Bioinformatics Biocomputing and Perl: An Introduction to Bioinformatics Computing Skills and Practice. Wiley; 1 edition, 2004. (EN)
Zaplatílek K, Doňar B: Matlab tvorba uživatelských aplikací, Technická literatura BEN, Praha 2004 (CS)

Zařazení předmětu ve studijních plánech

  • Program BTBIO-F magisterský navazující

    obor F-BTB , 1 ročník, zimní semestr, povinný

  • Program EEKR-CZV celoživotní vzdělávání (není studentem)

    obor ET-CZV , 1 ročník, zimní semestr, povinný

Typ (způsob) výuky

 

Přednáška

13 hod., nepovinná

Vyučující / Lektor

Osnova

1. Základy algoritmizace úloh (rekurzivní a iterační algoritmy, náročnost algoritmů].
2. Algoritmy vyhledávání - Exhaustive Search: restrikční mapování, vyhledávání motivů.
3. Algoritmy vyhledávání - Greedyho algoritmus: analýza genetických změn pomocí reverzí a tříděním metodou Breakpoints.
4. Dynamické programování (obecný popis metody, globální zarovnávání, lokální zarovnávání, optimální cesta, aplikace).
5. Shluková analýza pro analýzu genomických dat (základní principy, aplikace).
6. Skryté Markovovy modely pro analýzu genomických dat (základní principy, aplikace).

Cvičení na počítači

52 hod., povinná

Vyučující / Lektor

Osnova

1. Seznámení s provozním řádem počítačové laboratoře a náplní cvičení.
2. Základy algoritmizace úloh.
3. Rekurzivní a iterační algoritmy, náročnost algoritmů.
4. Exhaustive Search: restrikční mapování.
5. Exhaustive Search: vyhledávání motivů.
6. Greedyho algoritmus: analýza genetických změn pomocí reverzí
7. Analýza genetických změn metodou Breakpoints.
8. Dynamické programování: obecný popis metody, globální zarovnávání.
9. Dynamické programování: lokální zarovnávání, optimální cesta.
10. Shluková analýza pro analýzu genomických dat (základní principy, aplikace).
11. Skryté Markovovy modely pro analýzu genomických dat (základní principy, aplikace).
12. Náhradní cvičení.
13. Závěrečný test.