Detail předmětu

Praktika z bioinformatiky

FEKT-APBIAk. rok: 2015/2016

Předmět je zaměřen na praktické zvládnutí základních bioinformatických analýz DNA sekvencí a sekvencí proteinů. Především je orientován na zarovnávací algoritmy a algoritmy predikce sekundární struktury RNA a proteinů. Dále prohlubuje znalosti o možnostech číslicového zpracování genomických a proteomických dat. Studenti si prakticky vyzkouší základní možnosti fylogenetické analýzy na jimi zvoleném vhodném souboru dat.

Jazyk výuky

čeština

Počet kreditů

Garant předmětu

doc. Ing. Jana Kolářová, Ph.D.

Zajišťuje ústav

Ústav biomedicínského inženýrství (UBMI)

Výsledky učení předmětu

Absolvent předmětu je schopen:
- nalézt v databázi GenBank nukleotidové sekvence kódující protein pro různé organismy a sekvence stáhnout ve vhodném formátu
- nalézt v databázi Uniprot sekvenci proteinu, která je kódována nukleotidovou sekvencí
- nalézt kódující oblasti v DNA sekvencích
- naprogramovat dotmatrix plot pro nukleotidové a aminokyselinové sekvence a vhodně zvolit parametry filtrace
- použít zarovnávací algoritmy volně dostupné na internetu, vhodně zvolit zarovnávací parametry v závislosti na typu dat
- naprogramovat algoritmus pro globální a lokální zarovnání sekvencí
- predikovat sekundární strukturu RNA sekvencí pomocí online nástrojů
- predikovat sekundární strukturu proteinů pomocí online nástrojů
- naprogramovat numerickou reprezentaci DNA sekvencí pro 1. a 4. kvadrant a porovnat sekvence na základě Eukleidovských vzdáleností mezi numerickými signály
- naprogramovat diskrétní Fourierovu transformaci pro DNA sekvence pro pevnou velikost výpočetního okna a posuvné výpočetní okno
- naprogramovat výpočet spektrogramů DNA sekvencí
- zkonstruovat fylogenetický strom z DNA sekvencí pomocí online nástrojů

Prerekvizity

Student by měl mít znalosti ekvivalentní absolvování předmětu ABIN. Student musí být schopen základní práce s programovým prostředí Matlab či jiným programovacím jazykem. Student musí znát základní molekulárně-biologické vlastnosti nukleotidových a proteinových sekvencí, teoretické principy globálního a lokálního zarovnávání a predikce sekundární struktury proteinů.

Plánované vzdělávací činnosti a výukové metody

Metody vyučování závisejí na způsobu výuky a jsou popsány článkem 7 Studijního a zkušebního řádu VUT.

Způsob a kritéria hodnocení

Student během semestru může získat:
až 30 bodů za bodované programování,
až 30 bodů za průběžný test,
až 40 bodů za praktický úkol.

Osnovy výuky

1. Vyhledávání sekvencí v databázích.
2. Vyhledávání kódujících úseků v DNA sekvencích a zarovnávání sekvencí.
3. Vícenásobné zarovnávání sekvencí.
4. Predikce sekundární struktury RNA sekvencí.
5. Predikce proteinových struktur.
6. Numerické reprezentace.
7. Diskrétní Fourierova transformace pro DNA a proteinové sekvence.
8. Spektrogramy pro DNA a proteinové sekvence.
9. Numerické reprezentace pomocí EIIP hodnot a jejich spektrogramy.
10. Konstrukce fylogenetickcýh stromů.

Učební cíle

Cílem předmětu je studenty naučit vyhledávat data v základních genomických a proteomických databázích jako je GenBank a Uniprot, získaná data analyzovat volně dostupnými nástroji pro základní bioinformatické analýzy a také naprogramovat některé základní bioinformatické algoritmy.

Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky

Počítačová cvičení jsou povinná, řádně omluvené zmeškané cvičení lze po domluvě s vyučujícím nahradit individuálně.

Základní literatura

Cvrčková F: Úvod do praktické bioinformatiky, Academia, 2006 (CS)

Zařazení předmětu ve studijních plánech

Program BTBIO-A bakalářský
obor A-BTB , 3 ročník, letní semestr, povinný
Program EEKR-CZV celoživotní vzdělávání (není studentem)
obor ET-CZV , 1 ročník, letní semestr, povinný

Typ (způsob) výuky

Cvičení na počítači

39 hod., povinná

Vyučující / Lektor

Ing. Denisa Maděránková, Ph.D.
Ing. Radovan Smíšek, Ph.D.

Osnova

1. Bioinformatická data. Genomové sekvence organismů. Veřejně dostupné databáze. Načítání, zobrazování dat v Matlabu. Přehled základních úloh bioinformatiky řešené v programovém prostředí Matlab.
2. Zpracování genomových sekvencí pomocí základních pravidel statistiky.
3. Porovnávání sekvencí. Zarovnávání sekvencí. Míry shody.
4. Hledání vzorů v sekvencích.
5. Nelineární metody pro porovnávání vzorů, metoda dynamického borcení času.
6. Skryté Markovovy modely v úlohách rozpoznávání.
7. Hledání vzorů pomocí nelineárních metod pro klasifikační úlohy.
8. Shluková analýza s využitím nelineárních metod srovnávání.
9. Statistické vyhodnocení klasifikačních postupů, objemy zpracovávaných dat.
10. Expertní systém jako klasifikátor.
11. Prezentace samostatných prací.
12. Prezentace samostatných prací.
13. Zápočtový test.

VUT

Fakulty

Vysokoškolské ústavy

Součásti

Praktika z bioinformatiky

Typ (způsob) výuky