Detail předmětu

Praktika z bioinformatiky

FEKT-APBIAk. rok: 2014/2015

Předmět je zaměřen na praktické zvládnutí základních bioinformatických analýz DNA sekvencí a sekvencí proteinů. Především je orientován na zarovnávací algoritmy a algoritmy predikce sekundární struktury RNA a proteinů. Dále prohlubuje znalosti o možnostech číslicového zpracování genomických a proteomických dat. Studenti si prakticky vyzkouší základní možnosti fylogenetické analýzy na jimi zvoleném vhodném souboru dat.

Jazyk výuky

čeština

Počet kreditů

3

Výsledky učení předmětu

Absolvent předmětu je schopen:
- nalézt v databázi GenBank nukleotidové sekvence kódující protein pro různé organismy a sekvence stáhnout ve vhodném formátu
- nalézt v databázi Uniprot sekvenci proteinu, která je kódována nukleotidovou sekvencí
- nalézt kódující oblasti v DNA sekvencích
- naprogramovat dotmatrix plot pro nukleotidové a aminokyselinové sekvence a vhodně zvolit parametry filtrace
- použít zarovnávací algoritmy volně dostupné na internetu, vhodně zvolit zarovnávací parametry v závislosti na typu dat
- naprogramovat algoritmus pro globální a lokální zarovnání sekvencí
- predikovat sekundární strukturu RNA sekvencí pomocí online nástrojů
- predikovat sekundární strukturu proteinů pomocí online nástrojů
- naprogramovat numerickou reprezentaci DNA sekvencí pro 1. a 4. kvadrant a porovnat sekvence na základě Eukleidovských vzdáleností mezi numerickými signály
- naprogramovat diskrétní Fourierovu transformaci pro DNA sekvence pro pevnou velikost výpočetního okna a posuvné výpočetní okno
- naprogramovat výpočet spektrogramů DNA sekvencí
- zkonstruovat fylogenetický strom z DNA sekvencí pomocí online nástrojů

Prerekvizity

Student by měl mít znalosti ekvivalentní absolvování předmětu ABIN. Student musí být schopen základní práce s programovým prostředí Matlab či jiným programovacím jazykem. Student musí znát základní molekulárně-biologické vlastnosti nukleotidových a proteinových sekvencí, teoretické principy globálního a lokálního zarovnávání a predikce sekundární struktury proteinů.

Plánované vzdělávací činnosti a výukové metody

Metody vyučování závisejí na způsobu výuky a jsou popsány článkem 7 Studijního a zkušebního řádu VUT.

Způsob a kritéria hodnocení

Student získává v průběhu semestru až 30 bodů za bodované programování, až 40 bodů za průběžné testy a až 30 bodů za vypracování protokolu o analýzách dat. Pro úspěšné absolvování předmětu je nutné získat minimálně 35 bodů za průběžné testy a bodované programování a celkově minimálně 50 bodů.

Osnovy výuky

1. Úvod do programovacího jazyka R.
2. Vyhledávání kódujících úseků v DNA sekvencích a zarovnávání sekvencí.
3. Vícenásobné zarovnávání sekvencí.
4. Predikce sekundární struktury RNA sekvencí.
5. Predikce proteinových struktur.
6. Numerické reprezentace.
7. Diskrétní Fourierova transformace pro DNA a proteinové sekvence.
8. Spektrogramy pro DNA a proteinové sekvence.
9. Numerické reprezentace pomocí EIIP hodnot a jejich spektrogramy.
10. Konstrukce fylogenetickcýh stromů.

Učební cíle

Cílem předmětu je studenty naučit vyhledávat data v základních genomických a proteomických databázích jako je GenBank a Uniprot, získaná data analyzovat volně dostupnými nástroji pro základní bioinformatické analýzy a také naprogramovat některé základní bioinformatické algoritmy.

Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky

Počítačová cvičení jsou povinná, řádně omluvené zmeškané cvičení lze po domluvě s vyučujícím nahradit individuálně.

Základní literatura

Cvrčková F: Úvod do praktické bioinformatiky, Academia, 2006 (CS)

Zařazení předmětu ve studijních plánech

  • Program BTBIO-A bakalářský

    obor A-BTB , 3 ročník, letní semestr, povinný

  • Program EEKR-CZV celoživotní vzdělávání (není studentem)

    obor ET-CZV , 1 ročník, letní semestr, povinný

Typ (způsob) výuky

 

Cvičení na počítači

39 hod., povinná

Vyučující / Lektor

Osnova

1. Bioinformatická data. Genomové sekvence organismů. Veřejně dostupné databáze. Načítání, zobrazování dat v Matlabu. Přehled základních úloh bioinformatiky řešené v programovém prostředí Matlab.
2. Zpracování genomových sekvencí pomocí základních pravidel statistiky.
3. Porovnávání sekvencí. Zarovnávání sekvencí. Míry shody.
4. Hledání vzorů v sekvencích.
5. Nelineární metody pro porovnávání vzorů, metoda dynamického borcení času.
6. Skryté Markovovy modely v úlohách rozpoznávání.
7. Hledání vzorů pomocí nelineárních metod pro klasifikační úlohy.
8. Shluková analýza s využitím nelineárních metod srovnávání.
9. Statistické vyhodnocení klasifikačních postupů, objemy zpracovávaných dat.
10. Expertní systém jako klasifikátor.
11. Prezentace samostatných prací.
12. Prezentace samostatných prací.
13. Zápočtový test.