Project detail
In vitro and in silico identification of non-canonical DNA structures in genomic sequences
Duration: 1.4.2008 — 31.12.2010
Funding resources
Grantová agentura České republiky - Standardní projekty
On the project
Sekvenování genomů zvýšilo zájem nejen o nekódující DNA, ale i o nekanonické struktury, které může nekódující DNA vytvářet, a jejich možné biologické funkce. V tomto návrhu hodláme skloubit nejnovějšími technologiemi molekulární biologii s bioinformatikou ve snaze pochopit, předpovídat a mapovat v lidském genomu výskyt biologicky důležitých struktur. Na základě předcházejícího výskumu se experimentálně soustředíme hlavně na detekci křížových struktur DNA a riplexů DNA. Zmodernizujeme a v případě křížových struktur vytvoříme výpočetní nástroj pro predikci těchto struktur v genomové DNA. Aplikace bude zahájena s regulačními oblastmi nádorových supresorů a onkogenů (např. p53) či jejich cílových genů (např. EGFR, c-myc, hsp90) studovaných v laboratoři navrhovatele. Rychlost počítačového zpracování celých genomů docílíme využitím vhodných algoritmů a jejich implementaci s podporou hradlových polí (FPGA). Takto budeme schopni rychle a s vyšší citlivostí anotovat genomy z pohledu výskytu zajímavých struktur, vyhodnotíme jejich výskyt v biologicky a medicinsky zajímavých genech a otevřeme cestu pro využití superrychlých operací v hardwaru i jiným oblastem bioinformatiky. Cílem je zdokonalit existující a vytvořit nové postupy pro identifikaci nekanonických struktur v DNA. Experimentálně se zaměříme na nádorové supresory a onkogeny, výpočetně na rychlost a citlivost metod a analýzu genomů. Vytvoříme pilotní server pro další výskum a využití v bioinformatice.
Description in English
Genomic sequencing generated an increased interest in non-coding DNA. This
applies also to non-canonical DNA structures and their possible biological
functions. Here we propose to combine molecular biology, bioinformatics and the
latest computer technology in an effort to understand, predict and map the
occurrence of biologically important DNA structures in genomes. Motivated by our
previous research, we will focus on
non-canonical DNA structures (cruciforms, triplex, slippage- and Z-DNA). We will
improve (and where necessary develop) tools for in silico prediction of these DNA
structures. Predictions will be verified by carefully planned laboratory
experiments, focusing on promoter regions of cancer-related genes (e.g. p53,
MDM2, hsp90, EGFR) studied in the applicant's laboratory. Our ability to rapidly
analyze full genomes will come from the use of special algorithms and
applications built around FPGA hardware-acceleration cards.
As a result, we will obtain annotations of genomes for predicted structures,
occurence of such structures in
oncogenes, as well as new methods and hardware for wider applications of
accelerated sequence search.
Keywords
nekanonická struktura DNA, palindrom, duplikace, duplex, triplex, přibližné
vyhledávání vzorů, bioinformatika, hradlová pole (FPGA)
Key words in English
non-canonical DNA structure, palindrome, repeat, duplex, triplex, cruciform DNA,
approximate pattern search, bioinformatics, FPGA
Mark
GA204/08/1560
Default language
Czech
People responsible
Fučík Otto, doc. Dr. Ing. - principal person responsible
Units
Faculty of Information Technology
- responsible department (13.5.2011 - not assigned)
Faculty of Information Technology
- co-beneficiary (1.4.2008 - 31.12.2010)
Faculty of Information Technology
- beneficiary (13.5.2011 - not assigned)
Results
MARTÍNEK, T. Hodnocení podobnosti biologických sekvencí s využitím technologie FPGA. Brno: Ústav počítačových systémů FIT VUT v Brně, 2010. s. 0-0.
Detail
LEXA, M.; MARTÍNEK, T.; BURGETOVÁ, I.; KOPEČEK, D.; BRÁZDOVÁ, M. A dynamic programming algorithm for identification of triplex-forming sequences. BIOINFORMATICS, 2011, vol. 27, no. 18, p. 2510-2517. ISSN: 1367-4803.
Detail
MARTÍNEK, T.; LEXA, M. Architecture Model for Approximate Tandem Repeat Detection. 22nd IEEE International Conference on Application-specific Systems, Architectures and Processors. Santa Monica, California: IEEE Computer Society, 2011. p. 239-242. ISBN: 978-1-4577-1290-6.
Detail
MARTÍNEK, T.; LEXA, M.: PalDPl; Identification of palindrome-forming sequences. http://www.fit.vutbr.cz/research/view_product.php?id=195¬itle=1. URL: http://www.fit.vutbr.cz/research/view_product.php?id=195¬itle=1. (software)
Detail
MARTÍNEK, T.; LEXA, M.; KOPEČEK, D.; BURGETOVÁ, I.: Triplex; Identification of triplex-forming sequences. http://www.fit.vutbr.cz/research/view_product.php?id=194¬itle=1. URL: http://www.fit.vutbr.cz/research/view_product.php?id=194¬itle=1. (software)
Detail
MARTÍNEK, T. Evaluation of Biological Sequence Similarity Using FPGA Technology. Information Sciences and Technologies Bulletin of the ACM Slovakia, 2010, vol. 2, no. 2, p. 93-102. ISSN: 1338-1237.
Detail
MARTÍNEK, T.; LEXA, M. Hardware Acceleration of Approximate Tandem Repeat Detection. IEEE Symposium on Field-Programmable Custom Computing Machines. Charlotte: IEEE Computer Society, 2010. p. 79-86. ISBN: 978-0-7695-4056-6.
Detail
MARTÍNEK, T.; LEXA, M.; VOŽENÍLEK, J. Architecture model for approximate palindrome detection. In 2009 IEEE Symposium on Design and Diagnostics of Electronic Circuits and Systems. Liberec: IEEE Computer Society, 2009. p. 90-95. ISBN: 978-1-4244-3339-1.
Detail
MARTÍNEK, T.; LEXA, M. Hardware Acceleration of Approximate Palindromes Searching. In The International Conference on Field-Programmable Technology. Taipei: IEEE Computer Society, 2008. p. 65-72. ISBN: 978-1-4244-2796-3.
Detail
Responsibility: Fučík Otto, doc. Dr. Ing.