Project detail

In vitro and in silico identification of non-canonical DNA structures in genomic sequences

Duration: 01.04.2008 — 31.12.2010

Funding resources

Czech Science Foundation - Standardní projekty

- whole funder (2008-04-01 - 2010-12-31)

On the project

Sekvenování genomů zvýšilo zájem nejen o nekódující DNA, ale i o nekanonické struktury, které může nekódující DNA vytvářet, a jejich možné biologické funkce. V tomto návrhu hodláme skloubit nejnovějšími technologiemi molekulární biologii s bioinformatikou ve snaze pochopit, předpovídat a mapovat v lidském genomu výskyt biologicky důležitých struktur. Na základě předcházejícího výskumu se experimentálně soustředíme hlavně na detekci křížových struktur DNA a riplexů DNA. Zmodernizujeme a v případě křížových struktur vytvoříme výpočetní nástroj pro predikci těchto struktur v genomové DNA. Aplikace bude zahájena s regulačními oblastmi nádorových supresorů a onkogenů (např. p53) či jejich cílových genů (např. EGFR, c-myc, hsp90) studovaných v laboratoři navrhovatele. Rychlost počítačového zpracování celých genomů docílíme využitím vhodných algoritmů a jejich implementaci s podporou hradlových polí (FPGA). Takto budeme schopni rychle a s vyšší citlivostí anotovat genomy z pohledu výskytu zajímavých struktur, vyhodnotíme jejich výskyt v biologicky a medicinsky zajímavých genech a otevřeme cestu pro využití superrychlých operací v hardwaru i jiným oblastem bioinformatiky.

Cílem je zdokonalit existující a vytvořit nové postupy pro identifikaci nekanonických struktur v DNA. Experimentálně se
zaměříme na nádorové supresory a onkogeny, výpočetně na rychlost a citlivost metod a analýzu genomů. Vytvoříme
pilotní server pro další výskum a využití v bioinformatice.

Description in English
Genomic sequencing generated an increased interest in non-coding DNA. This applies also to non-canonical DNA structures and their possible biological functions. Here we propose to combine molecular biology, bioinformatics and the latest computer technology in an effort to understand, predict and map the occurrence of biologically important DNA structures in genomes. Motivated by our previous research, we will focus on
non-canonical DNA structures (cruciforms, triplex, slippage- and Z-DNA). We will improve (and where necessary develop) tools for in silico prediction of these DNA structures. Predictions will be verified by carefully planned laboratory experiments, focusing on promoter regions of cancer-related genes (e.g. p53, MDM2, hsp90, EGFR) studied in the applicant's laboratory. Our ability to rapidly analyze full genomes will come from the use of special algorithms and applications built around FPGA hardware-acceleration cards.

As a result, we will obtain annotations of genomes for predicted structures, occurence of such structures in
oncogenes, as well as new methods and hardware for wider applications of accelerated sequence search.

Keywords
nekanonická struktura DNA, palindrom, duplikace, duplex, triplex, přibližné vyhledávání vzorů, bioinformatika, hradlová pole (FPGA)

Key words in English
non-canonical DNA structure, palindrome, repeat, duplex, triplex, cruciform DNA, approximate pattern search, bioinformatics, FPGA

Mark

GA204/08/1560

Default language

Czech

People responsible

Burgetová Ivana, Ing., Ph.D. - fellow researcher
Martínek Tomáš, doc. Ing., Ph.D. - fellow researcher
Fučík Otto, doc. Dr. Ing. - principal person responsible

Units

Faculty of Information Technology
- beneficiary (2011-05-13 - not assigned)

Results

MARTÍNEK, T.; LEXA, M. Hardware Acceleration of Approximate Palindromes Searching. In The International Conference on Field-Programmable Technology. Taipei: IEEE Computer Society, 2008. p. 65-72. ISBN: 978-1-4244-2796-3.
Detail

MARTÍNEK, T.; LEXA, M.; VOŽENÍLEK, J. Architecture model for approximate palindrome detection. In 2009 IEEE Symposium on Design and Diagnostics of Electronic Circuits and Systems. Liberec: IEEE Computer Society, 2009. p. 90-95. ISBN: 978-1-4244-3339-1.
Detail

MARTÍNEK, T.; LEXA, M. Hardware Acceleration of Approximate Tandem Repeat Detection. IEEE Symposium on Field-Programmable Custom Computing Machines. Charlotte: IEEE Computer Society, 2010. p. 79-86. ISBN: 978-0-7695-4056-6.
Detail

LEXA, M.; MARTÍNEK, T.; BURGETOVÁ, I.; KOPEČEK, D.; BRÁZDOVÁ, M. A dynamic programming algorithm for identification of triplex-forming sequences. BIOINFORMATICS, 2011, vol. 27, no. 18, p. 2510-2517. ISSN: 1367-4803.
Detail

MARTÍNEK, T. Evaluation of Biological Sequence Similarity Using FPGA Technology. Information Sciences and Technologies Bulletin of the ACM Slovakia, 2010, vol. 2, no. 2, p. 93-102. ISSN: 1338-1237.
Detail

MARTÍNEK, T.; LEXA, M. Architecture Model for Approximate Tandem Repeat Detection. 22nd IEEE International Conference on Application-specific Systems, Architectures and Processors. Santa Monica, California: IEEE Computer Society, 2011. p. 239-242. ISBN: 978-1-4577-1290-6.
Detail

MARTÍNEK, T.; LEXA, M.: PalDPl; Identification of palindrome-forming sequences. http://www.fit.vutbr.cz/research/view_product.php?id=195¬itle=1. URL: http://www.fit.vutbr.cz/research/view_product.php?id=195¬itle=1. (software)
Detail

MARTÍNEK, T.; LEXA, M.; KOPEČEK, D.; BURGETOVÁ, I.: Triplex; Identification of triplex-forming sequences. http://www.fit.vutbr.cz/research/view_product.php?id=194¬itle=1. URL: http://www.fit.vutbr.cz/research/view_product.php?id=194¬itle=1. (software)
Detail