Project detail

High throughput bacterial genome assembly and annotation techniques using genomic signal processing

Duration: 01.01.2017 — 31.12.2019

Funding resources

Czech Science Foundation - Standardní projekty

- whole funder (2017-01-01 - 2019-12-31)

On the project

Projekt se zabývá výpočetní celogenomovou analýzou bakteriálních genomů pomocí metod číslicového zpracování signálů (DSP). První částí projektu je vývoj nového algoritmu pro skládání genomu s detekcí segmentů s variabilním počtem kopií (CNV) ze sekvenačních dat v signálové podobě. Tento algoritmus umožní lépe zachovat repetitivní informaci obsaženou v sekvenci nezbytnou pro další část projektu. Ta je zaměřena na detekci a klasifikaci mobilních genetických elementů (MGE) nesoucích geny antibiotické rezistence. Na základě známých MGE s pomocí metod DSP jako spektrální analýza, vlnková transformace nebo nukleotidové denzitní motivy bude sestavován vektor charakteristických příznaků potřebný pro sestavení klasifikačního modelu metodami strojového učení. Klasifikační modely budou použity pro identifikaci nepopsaných MGE, což povede k přesnějšímu popisu vzniku a šíření bakteriální rezistence. Vývoj výpočetních metod bude testován a laboratorně ověřen na reálných záznamech genomů bakterií Klebsiella pneumoniae a Clostridium difficile laboratoří molekulární biologie FN Brno.

Description in English
The project is focused on computational whole-genome analysis of bacteria using digital signal processing methods (DSP). As first, a new algorithm for genome assembly will be developed with detection of copy number variation segments (CNV) from sequencing data in signal representation. The algorithm will better preserve repetitive information in the genome which is necessary for detection and classification of mobile genetic elements (MGE) that carry genes of antibiotic resistance. A vector of characteristic features will be constructed on the basis of known MGE and with the help of DSP methods like spectral analysis or wavelet transform. The vector is needed for compilation of classification model using machine learning techniques which will be used to identify undescribed MGE to provide more precise description of origin and spreading of bacterial resistance. The development of new computational methods will be tested and laboratory validated on real genomes of bacteria Klebsiella pneumoniae and Clostridium difficile in labs of University Hospital Brno.

Keywords
číslicové zpracování signálů;genomický signál;celogenomová analýza;antibiotická rezistence;de-novo sestavování genomu;sekvenování nové generace;mobilní genetické elementy;metody strojového učení;Fourierova transformace;vlnková transformace;

Key words in English
digital signal processing;genomic signal;whole-genome analysis;antibiotic resistance;de-novo genome assembly;Next-Gen Sequencing;mobile genetic elements;machine learning techniques;Fourier transform;wavelet transform;

Mark

GA17-01821S

Default language

Czech

People responsible

Vítková Helena, Ing., Ph.D. - principal person responsible

Units

Department of Biomedical Engineering
- beneficiary (2017-01-01 - not assigned)

Results

JUGAS, R. DNA reads feature extraction analysis. In Proceedings of IEEE Student Branch Conference Mikulov 2017. 2017. p. 33-36. ISBN: 978-80-214-5526-9.
Detail

NYKRÝNOVÁ, M.; BARTOŇ, V.; SEDLÁŘ, K.; BEZDÍČEK, M.; LENGEROVÁ, M.; ŠKUTKOVÁ, H. Word entropy-based approach to detect highly variable genetic markers for bacterial genotyping. Frontiers in Microbiology, 2021, vol. 12, no. 1, p. 1-8. ISSN: 1664-302X.
Detail

KUPKOVÁ, K.; SEDLÁŘ, K.; PROVAZNÍK, I. Reference-free Identification of Phage DNA Using Signal Processing on Nanopore Data. In 2017 IEEE 17th International Conference on Bioinformatics and Bioengineering, BIBE 2017. Washington DC: Conference Publishing Services, 2017. p. 101-105. ISBN: 978-1-5386-1324-5.
Detail

JUGAS, R.; SEDLÁŘ, K.; ŠKUTKOVÁ, H.; VÍTEK, M. Overlap detection for a genome assembly based on genomic signal processing. In 2017 IEEE 30th International Symposium on Computer-Based Medical Systems. Proceedings of the ... IEEE International Symposium on Computer-Based Medical Systems. USA: IEEE Computer Society, 2017. p. 301-305. ISBN: 978-1-5386-1710-6. ISSN: 2372-9198.
Detail

JUGAS, R. Application of Optimization Algorithms to the Genome Assembly. In Proceedings of the 24th Conference STUDENT EEICT 2018. Brno: Vysoké učení technické v Brně, Fakulta elektrotechniky a komunikačních, 2018. p. 595-599. ISBN: 978-80-214-5614-3.
Detail

JUGAS, R.; VÍTEK, M.; SEDLÁŘ, K.; ŠKUTKOVÁ, H. Cross-Correlation Based Detection of Contigs Overlaps. In MIPRO 2018 proceedings. New York: IEEE, 2018. p. 155-158. ISBN: 978-953-233-095-3.
Detail

NYKRÝNOVÁ, M.; MADĚRÁNKOVÁ, D. GENOTYPING OF KLEBSIELLA PNEUMONIAE ISOLATES. In Proceedings of the 24th Conference STUDENT EEICT 2018. 2018. ISBN: 978-80-214-5614-3.
Detail

NYKRÝNOVÁ, M.; MADĚRÁNKOVÁ, D.; BEZDÍČEK, M.; LENGEROVÁ, M.; ŠKUTKOVÁ, H. Bioinformatic Tools for Genotyping of Klebsiella pneumoniae Isolates. In Information Technology in Biomedicine. 2019. p. 419-428. ISBN: 978-3-319-91210-3.
Detail

MADĚRÁNKOVÁ, D.; JUGAS, R.; SEDLÁŘ, K.; VÍTEK, M.; ŠKUTKOVÁ, H. Rapid bacterial species delineation based on parameters derived from genome numerical representations. Computational and Structural Biotechnology Journal, 2019, vol. 17, no. 1, p. 118-126. ISSN: 2001-0370.
Detail

ŠKUTKOVÁ, H.; VÍTEK, M.; BEZDÍČEK, M.; BRHELOVÁ, E.; LENGEROVÁ, M. Advanced DNA fingerprint genotyping based on a model developed from real chip electrophoresis data. Journal of Advanced Research, 2019, vol. 18, no. 18, p. 9-18. ISSN: 2090-1232.
Detail

ŠKUTKOVÁ, H.; MADĚRÁNKOVÁ, D.; SEDLÁŘ, K.; JUGAS, R.; VÍTEK, M. A degeneration-reducing criterion for optimal digital mapping of genetic codes. Computational and Structural Biotechnology Journal, 2019, vol. 17, no. 1, p. 406-414. ISSN: 2001-0370.
Detail

NYKRÝNOVÁ, M.; MADĚRÁNKOVÁ, D.; BARTOŇ, V.; BEZDÍČEK, M.; LENGEROVÁ, M.; ŠKUTKOVÁ, H. Entropy-Based Detection of Genetic Markers for Bacteria Genotyping. In Bioinformatics and Biomedical Engineering. IWBBIO 2019. Lecture Notes in Computer Science. 2019. p. 177-188. ISBN: 978-3-030-17934-2. ISSN: 0302-9743.
Detail

BARTOŇ, V.; NYKRÝNOVÁ, M.; BEZDÍČEK, M.; LENGEROVÁ, M.; ŠKUTKOVÁ, H. Clustering of Klebsiella Strains Based on Variability in Sequencing Data. In Bioinformatics and Biomedical Engineering. IWBBIO 2019. Lecture Notes in Computer Science. 2019. p. 189-199. ISBN: 978-3-030-17934-2. ISSN: 0302-9743.
Detail

JUGAS, R.; VÍTEK, M.; MADĚRÁNKOVÁ, D.; ŠKUTKOVÁ, H. Signal processing based CNV detection in bacterial genomes. In Bioinformatics and Biomedical Engineering. IWBBIO 2019. Lecture Notes in Computer Science. Granada, Spain: Springer Verlag, 2019. p. 93-102. ISBN: 978-3-030-17937-3. ISSN: 0302-9743.
Detail

BEZDÍČEK, M.; NYKRÝNOVÁ, M.; PLEVOVÁ, K.; BRHELOVÁ, E.; KOCMANOVÁ, I.; SEDLÁŘ, K.; RÁČIL, Z.; MAYER, J.; LENGEROVÁ, M. Application of mini-MLST and whole genome sequencing in low diversity hospital extended-spectrum beta-lactamase producing Klebsiella pneumoniae population. PLOS ONE, 2019, vol. 14, no. 8, p. 1-14. ISSN: 1932-6203.
Detail

BARTOŇ, V.; ŠKUTKOVÁ, H. Watershed Segmentation for Peak Picking of High-Resolution Mass Spectrometry Data. In Proceedings of IEEE Student Branch Conference Mikulov2019. Brno: Vysoké učení technické v Brně, Fakulta elektrotechniky a komunikačních technologií, 2019. p. 23-25. ISBN: 978-80-214-5781-2.
Detail

NYKRÝNOVÁ, M.; ŠKUTKOVÁ, H. Method for improving the consensus sequence from NGS data based on reads classification. In Proceedings of IEEE Student Branch Conference Mikulov 2019. Brno: Vysoké učení technické v Brně, Fakulta elektrotechniky a komunikačních technologií, 2019. p. 6-9. ISBN: 978-80-214-5781-2.
Detail

NYKRÝNOVÁ, M.; BARTOŇ, V.; BEZDÍČEK, M.; LENGEROVÁ, M.; ŠKUTKOVÁ, H. Detection of Highly Variable Genome Fragments in Unmapped Reads of Escherichia coli Genomes. In Bioinformatics and Biomedical Engineering. Lecture Notes in Computer Science. 2020. p. 569-578. ISBN: 978-3-030-45384-8. ISSN: 0302-9743.
Detail

MUSILOVÁ, J.; KOUŘILOVÁ, X.; BEZDÍČEK, M.; LENGEROVÁ, M.; OBRUČA, S.; ŠKUTKOVÁ, H.; SEDLÁŘ, K. First Complete Genome of the Thermophilic Polyhydroxyalkanoates Producing Bacterium Schlegelella thermodepolymerans DSM 15344. GENOME BIOL EVOL, 2021, vol. 13, no. 4, p. 1-13. ISSN: 1759-6653.
Detail

MADĚRÁNKOVÁ, D.; SEDLÁŘ, K.; VÍTEK, M.; ŠKUTKOVÁ, H. The identification of replication origin in bacterial genomes by cumulated phase signal. In 2017 IEEE Conference on Computational Intelligence in Bioinformatics and Computational Biology (CIBCB). IEEE, 2017. p. 267-271. ISBN: 978-1-4673-8988-4.
Detail