Bachelor's Thesis

Sequential Reporting in a Healthcare IS

Final Thesis 3.28 MB

Author of thesis: Bc. Denis Adásek

Acad. year: 2023/2024

Supervisor: Ing. Vladimír Bartík, Ph.D.

Reviewer: Ing. Ivana Burgetová, Ph.D.

Abstract:

The thesis focuses on mining sequential patterns in data, which consist of the history of actions performed by users of a healthcare management information system. The objective of the thesis is to design and implement an application that creates a predictive model based on frequent sequences. This model is capable of predicting potential subsequent actions based on those already taken. The outcome of the thesis includes valid predictions of possible user behaviors within the system based on performed activities.

Keywords:

information systems, Management Information System, data warehouses, Online Analytical Processing, knowledge discovery in databases, data mining, sequential patterns, mining of sequential patterns, pattern expansion, PrefixSpan

Date of defence

11.06.2024

Result of the defence

Defended (thesis was successfully defended)

znamkaDznamka

Grading

D

Process of defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D.

Topics for thesis defence

  1. Jakým způsobem dochází k výběru doporučeného následujícího kroku, pokud je možné aplikovat více sekvenčních vzorů různé délky?
  2. Proč jste nedodal vlastní soubor testovacích hodnot, aby bylo možné vaše řešení vyzkoušet?
  3. Je možné data zveřejnit?

Language of thesis

Slovak

Faculty

Department

Study programme

Information Technology (BIT)

Composition of Committee

doc. Ing. Tomáš Martínek, Ph.D. (předseda)
Ing. Ivana Burgetová, Ph.D. (člen)
Ing. Vladimír Veselý, Ph.D. (člen)
doc. Mgr. Adam Rogalewicz, Ph.D. (člen)
Ing. Tomáš Milet, Ph.D. (člen)

Supervisor’s report
Ing. Vladimír Bartík, Ph.D.

Zadání bylo splněno. S přihlédnutím k celkové kvalitě a zmíněným časovým problémům navrhuji hodnocení bakalářské práce pana Adáska stupněm D (uspokojivě). 

Evaluation criteria Verbal classification
Informace k zadání

Tato bakalářská práce vznikla ve spolupráci s partnerskou firmou Stapro. Cílem bylo prostudovat problematiku dolování sekvenčních vzorů a použít tyto metody pro data, která reprezentují sekvence kroků uživatelů v rámci práce s IS. Na základě získaných sekvenčních vzorů pak je možné, aby IS vydával doporučení uživatelům ohledně dalších kroků. Student splnil všechny body zadání.

Práce s literaturou

Některé studijní prameny jsem studentovi poskytl, některé další si vyhledal samostatně. K práci s literaturou nemám výhrady.

Aktivita během řešení, konzultace, komunikace

Konzultace během řešení nebyly příliš časté, student však své řešení průběžně konzultoval se zadavatelem.

Aktivita při dokončování

Práce byla dokončována ve spěchu a na poslední chvíli, přesto jsem měl možnost technickou zprávu i realizační výstup před odevzdáním vidět. Alespoň o trochu větší předstih bych však ocenil.

Publikační činnost, ocenění
Points proposed by supervisor: 66
Display more

Grade proposed by supervisor: D

Reviewer’s report
Ing. Ivana Burgetová, Ph.D.

V rámci této práce vznikl jednoduchý, ale funkční nástroj pro dolování sekvenčních vzorů, který může být využitý v praxi. Realizační výstup práce hodnotím jako průměrný. Bohužel předložená technická zpráva vykazuje řadu nedostatků. Proto celkově navrhuji hodnocení stupněm D.

Evaluation criteria Verbal classification Points
Náročnost zadání

Evaluation level: průměrně obtížné zadání

Prezentační úroveň technické zprávy

Prezentační úroveň technické zprávy není příliš dobrá. Některé pasáže (především v kapitole 6) jsou příliš stručné a vyvozené závěry jsou tak jen stěží pochopitelné. Na druhou stranu informace o datových skladech jsou v textu uvedeny dvakrát (kapitoly 2.5 a 3.3.2). V práci je obsaženo mnoho obrázků a tabulek, které nejsou v textu vůbec odkazovány, jiné jsou odkazovány pouze pozičně. V textu jsou také chyby, které komplikují pochopení textu práce (např. na straně 21 v bodě 3a. je jedna ze sekvencí zapsána chybně), a terminologické nepřesnosti (např. "vzdialená funkcie").

60
Formální úprava technické zprávy

Technická zpráva obsahuje poměrně velké množství gramatických chyb a překlepů. Z typografického hlediska se jedná o standardní práci.

65
Realizační výstup

V rámci této práce vznikl jednoduchý nástroj na dolování sekvenčních vzorů chování uživatelů v manažerském informačním systému firmy STAPRO. Nástroj je funkční, v technické zprávě jsou popsány některé nalezené sekvenční vzory. Oceňuji snahu studenta nalézt vhodné hodnoty parametrů určujících maximální časové rozpětí mezi jednotlivými událostmi a maximální délku sekvencí. Na druhou stranu v odevzdaném řešení postrádám alespoň vzorek dat, nad kterým by bylo možné funkčnost aplikace ověřit.

79
Využitelnost výsledků

Student vytvořil nástroj určený pro manažerský informační systém firmy STAPRO. Nástroj je schopen nalézt sekvenční vzory v chování uživatelů, které mohou být využity pro nápovědu dalších kroků uživatelům systému. Podle informací uvedených v technické zprávě jsou nalezené sekvenční vzory z pohledu firmy STAPRO užitečné, proto je zde šance, že výsledky práce budou využity v praxi.

Rozsah splnění požadavků zadání

Evaluation level: zadání splněno

Rozsah technické zprávy

Evaluation level: je v obvyklém rozmezí

Práce s literaturou

Výběr studijních pramenů je dobrý. Student využil zdroje relevantní ke zpracovávanému tématu. Převzaté prvky jsou v práci odlišeny od vlastních výsledků a úvah.

78
Topics for thesis defence:
  1. Jakým způsobem dochází k výběru doporučeného následujícího kroku, pokud je možné aplikovat více sekvenčních vzorů různé délky?
Points proposed by reviewer: 68
Display more

Grade proposed by reviewer: D