Detail předmětu

Praktika z bioinformatiky

FEKT-BPC-PBIAk. rok: 2024/2025

Předmět je zaměřen na praktické zvládnutí základních bioinformatických analýz DNA sekvencí a sekvencí proteinů. Především je orientován na zarovnávací algoritmy a algoritmy predikce sekundární struktury RNA a proteinů. Dále prohlubuje znalosti o možnostech číslicového zpracování genomických a proteomických dat. Studenti si prakticky vyzkouší základní možnosti fylogenetické analýzy na jimi zvoleném vhodném souboru dat. Studenti se naučí provádět analýzy sekvencí v programovacím jazyce R.

Jazyk výuky

čeština

Počet kreditů

3

Vstupní znalosti

Student by měl mít znalosti ekvivalentní absolvování předmětu ABIN. Student musí být schopen základní práce s programovým prostředí Matlab či jiným programovacím jazykem. Student musí znát základní molekulárně-biologické vlastnosti nukleotidových a proteinových sekvencí, teoretické principy globálního a lokálního zarovnávání a predikce sekundární struktury proteinů.

Pravidla hodnocení a ukončení předmětu

Student získává v průběhu semestru až 30 bodů za programování, až 30 bodů za praktický úkol a až 40 bodů za zápočtový test. Pro úspěšné absolvování předmětu je nutné získat minimálně 15 bodů za programování, minimálně 20 bodů za zápočtový test a minimálně celkem 50 bodů dohromady za všechny bodované aktivity.
Počítačová cvičení jsou povinná, řádně omluvené zmeškané cvičení lze po domluvě s vyučujícím nahradit individuálně.

Učební cíle

Cílem předmětu je studenty naučit vyhledávat data v základních genomických a proteomických databázích jako je GenBank a Uniprot, získaná data analyzovat volně dostupnými nástroji pro základní bioinformatické analýzy a také naprogramovat některé základní bioinformatické algoritmy v programovacím jazyce R.
Absolvent předmětu je schopen:
- nalézt v databázi GenBank nukleotidové sekvence kódující protein pro různé organismy a sekvence stáhnout ve vhodném formátu
- nalézt v databázi Uniprot sekvenci proteinu, která je kódována nukleotidovou sekvencí
- nalézt kódující oblasti v DNA sekvencích
- provést základní analýzy sekvencí v prostředí R
- použít zarovnávací algoritmy volně dostupné na internetu, vhodně zvolit zarovnávací parametry v závislosti na typu dat
- naprogramovat algoritmus pro zarovnání sekvencí s afinní penalizací
- predikovat sekundární strukturu proteinů pomocí online nástrojů
- predikovat pozitivní selekci v genech
- naprogramovat výpočet spektrogramů DNA sekvencí
- zkonstruovat fylogenetický strom z DNA sekvencí pomocí online nástrojů

Základní literatura

Cvrčková F: Úvod do praktické bioinformatiky, Academia, 2006 (CS)

Zařazení předmětu ve studijních plánech

  • Program BPC-BTB bakalářský 3 ročník, letní semestr, povinný

Typ (způsob) výuky

 

Cvičení na počítači

39 hod., povinná

Vyučující / Lektor

Osnova

1. Bioinformatická data. Genomové sekvence organismů. Veřejně dostupné databáze. Načítání, zobrazování dat v Matlabu. Přehled základních úloh bioinformatiky řešené v programovém prostředí Matlab.
2. Zpracování genomových sekvencí pomocí základních pravidel statistiky.
3. Porovnávání sekvencí. Zarovnávání sekvencí. Míry shody.
4. Hledání vzorů v sekvencích.
5. Nelineární metody pro porovnávání vzorů, metoda dynamického borcení času.
6. Skryté Markovovy modely v úlohách rozpoznávání.
7. Hledání vzorů pomocí nelineárních metod pro klasifikační úlohy.
8. Shluková analýza s využitím nelineárních metod srovnávání.
9. Statistické vyhodnocení klasifikačních postupů, objemy zpracovávaných dat.
10. Expertní systém jako klasifikátor.
11. Prezentace samostatných prací.
12. Prezentace samostatných prací.
13. Zápočtový test.