Detail předmětu
Praktika z bioinformatiky
FEKT-APBIAk. rok: 2015/2016
Předmět je zaměřen na praktické zvládnutí základních bioinformatických analýz DNA sekvencí a sekvencí proteinů. Především je orientován na zarovnávací algoritmy a algoritmy predikce sekundární struktury RNA a proteinů. Dále prohlubuje znalosti o možnostech číslicového zpracování genomických a proteomických dat. Studenti si prakticky vyzkouší základní možnosti fylogenetické analýzy na jimi zvoleném vhodném souboru dat.
Jazyk výuky
Počet kreditů
Garant předmětu
Zajišťuje ústav
Výsledky učení předmětu
- nalézt v databázi GenBank nukleotidové sekvence kódující protein pro různé organismy a sekvence stáhnout ve vhodném formátu
- nalézt v databázi Uniprot sekvenci proteinu, která je kódována nukleotidovou sekvencí
- nalézt kódující oblasti v DNA sekvencích
- naprogramovat dotmatrix plot pro nukleotidové a aminokyselinové sekvence a vhodně zvolit parametry filtrace
- použít zarovnávací algoritmy volně dostupné na internetu, vhodně zvolit zarovnávací parametry v závislosti na typu dat
- naprogramovat algoritmus pro globální a lokální zarovnání sekvencí
- predikovat sekundární strukturu RNA sekvencí pomocí online nástrojů
- predikovat sekundární strukturu proteinů pomocí online nástrojů
- naprogramovat numerickou reprezentaci DNA sekvencí pro 1. a 4. kvadrant a porovnat sekvence na základě Eukleidovských vzdáleností mezi numerickými signály
- naprogramovat diskrétní Fourierovu transformaci pro DNA sekvence pro pevnou velikost výpočetního okna a posuvné výpočetní okno
- naprogramovat výpočet spektrogramů DNA sekvencí
- zkonstruovat fylogenetický strom z DNA sekvencí pomocí online nástrojů
Prerekvizity
Plánované vzdělávací činnosti a výukové metody
Způsob a kritéria hodnocení
až 30 bodů za bodované programování,
až 30 bodů za průběžný test,
až 40 bodů za praktický úkol.
Osnovy výuky
2. Vyhledávání kódujících úseků v DNA sekvencích a zarovnávání sekvencí.
3. Vícenásobné zarovnávání sekvencí.
4. Predikce sekundární struktury RNA sekvencí.
5. Predikce proteinových struktur.
6. Numerické reprezentace.
7. Diskrétní Fourierova transformace pro DNA a proteinové sekvence.
8. Spektrogramy pro DNA a proteinové sekvence.
9. Numerické reprezentace pomocí EIIP hodnot a jejich spektrogramy.
10. Konstrukce fylogenetickcýh stromů.
Učební cíle
Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky
Základní literatura
Zařazení předmětu ve studijních plánech
Typ (způsob) výuky
Cvičení na počítači
Vyučující / Lektor
Osnova
2. Zpracování genomových sekvencí pomocí základních pravidel statistiky.
3. Porovnávání sekvencí. Zarovnávání sekvencí. Míry shody.
4. Hledání vzorů v sekvencích.
5. Nelineární metody pro porovnávání vzorů, metoda dynamického borcení času.
6. Skryté Markovovy modely v úlohách rozpoznávání.
7. Hledání vzorů pomocí nelineárních metod pro klasifikační úlohy.
8. Shluková analýza s využitím nelineárních metod srovnávání.
9. Statistické vyhodnocení klasifikačních postupů, objemy zpracovávaných dat.
10. Expertní systém jako klasifikátor.
11. Prezentace samostatných prací.
12. Prezentace samostatných prací.
13. Zápočtový test.