Master's Thesis
Assistance in Creating Medical Reports using Large Pretrained Language Models
Final Thesis 2 MBAuthor of thesis: Ing. Patrik Pricl
Acad. year: 2023/2024
Supervisor: RNDr. Marek Rychlý, Ph.D.
Reviewer: doc. Ing. Radek Burget, Ph.D.
Abstract:The thesis deals with the use of pre-trained language models for summarizing medical
documentation in the form of dismissal reports. To create a functional model, the LLaMA
architecture is used. Already existing models of the given architecture were used. The aim
of the experiments was to find a model that can generate part of the documentation in the
Czech language. The selected model was fine-tuned using the LoRA method. Subsequently,
the inference parameters were experimented with to find the most suitable ones so that the
model generates the most correct output. Web-client and server applications were also
created as part of the thesis, the purpose of which is to demonstrate the functionality of the fine-tuned model.
NLP, Text sumarization, Artificial intelligence, Large language models,Transformers, Peft,
LoRA, LLaMA, BERT, GPT, ChatGPT-3.5, Medical documents, Flask, Python, fine-
tuning
Date of defence
27.08.2024
Result of the defence
Defended (thesis was successfully defended)
Grading
D
Process of defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D.
Topics for thesis defence
- Při použití jazykových modelů pro konkrétní účel používáte dotazy (prompt), které kombinují instrukce v češtině i angličtině. Jaký je k tomu důvod?
- Jak vypadala trénovací a testovací sada? Co bylo jejich zdrojem?
- Jakou metriku jste používal pro porovnávání podobnosti zpráv napsaných lékařem a zpráv vygenerovaných vaším modelem?
- Byly zprávy vygenerované vaším modelem konzultovány se skutečnými lékaři? Jaká byla jejich zpětná vazba?
Language of thesis
English
Faculty
Department
Study programme
Information Technology and Artificial Intelligence (MITAI)
Specialization
Bioinformatics and Biocomputing (NBIO)
Composition of Committee
doc. Ing. Richard Růžička, Ph.D., MBA (předseda)
doc. Ing. František Zbořil, CSc. (člen)
doc. Mgr. Adam Rogalewicz, Ph.D. (člen)
Ing. Libor Polčák, Ph.D. (člen)
Mgr. Kamil Malinka, Ph.D. (člen)
doc. Ing. Tomáš Martínek, Ph.D. (člen)
Supervisor’s report
RNDr. Marek Rychlý, Ph.D.
Grade proposed by supervisor: D
Reviewer’s report
doc. Ing. Radek Burget, Ph.D.
Grade proposed by reviewer: C