Bachelor's Thesis

Tool for Processing Municipal Council Voting Data

Final Thesis 2.18 MB

Author of thesis: Bc. Adam Janošík

Acad. year: 2023/2024

Supervisor: Ing. Kristýna Zaklová

Reviewer: Ing. Jiří Hynek, Ph.D.

Abstract:

The aim of this work was to design a generic tool for data transformation of input data into data model of reference. Tool was created to be applicable for any possible dataset. Developed solution was implemented as a Python script, which, according to specified meta file, performs data transformation over input data. The correctness of data transformation into reference model was verified by importing the data in an visualizing app that allowed to check the correctness of the transformed data. Developed solution makes data transformation of different data easier. Tool can be used as a part of the project of data visualization.

Keywords:

council, council voting, open data, dataset, meta model, data mining, CRISP-DM, data preprocessing, Python

Date of defence

12.06.2024

Result of the defence

Defended (thesis was successfully defended)

znamkaCznamka

Grading

C

Process of defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.

Topics for thesis defence

  1. Velké množství dostupných datových sad je ve formátu HTML. Jak byste zajistil podporu tohoto formátu?
  2. Definice vlastních funkcí pro zpracování dat je nyní psaná do souboru ve formátu JSON, což je značně nepraktické. Jak by bylo možné řešení vylepšit?

Language of thesis

Czech

Faculty

Department

Study programme

Information Technology (BIT)

Composition of Committee

doc. Dr. Ing. Dušan Kolář (předseda)
Ing. Vladimír Bartík, Ph.D. (člen)
Ing. Jaroslav Dytrych, Ph.D. (člen)
doc. Mgr. Adam Rogalewicz, Ph.D. (člen)
Ing. Marcela Zachariášová, Ph.D. (člen)

Supervisor’s report
Ing. Kristýna Zaklová

Student vytvořil použitelné řešení pro předzpracování relevantních datových sad do požadovaného formátu. Pro možnost širšího využívání nástroje bude nutné přidání podpory dalších dominantních datových formátů. Dosažené výsledky tvoří dobrý základ nástroje, který však mohl být propracovanější. Navrhuji proto hodnocení stupněm B.

Evaluation criteria Verbal classification
Informace k zadání

Zadání vzniklo jako pokračování projektu pro zpracování, analýzu a vizualizaci dat z hlasování obecních zastupitelstev. Student provedl analýzu dostupných relevantních dat a seznámil se s vytvořeným datovým modelem pro hlasovací data. Výsledky práce zahrnují generický nástroj pro zpracování hlasovacích datových sad ve formátu CSV, XML nebo JSON; a pět transformovaných datových sad. Vytvořený nástroj podporuje pouze datové sady dostupné v Národním katalogu otevřených dat, žádná zpracovaná data nepocházejí z webových stránek municipalit – pro tento účel postrádám podporu zpracování minimálně HTML souborů. Zadání hodnotím jako průměrně obtížné.

Práce s literaturou

Student nastudoval doporučenou literaturu a samostatně vyhledával další relevantní zdroje.

Aktivita během řešení, konzultace, komunikace

V zimním semestru byl student méně aktivní, v letním semestru se řešení bakalářské práce věnoval více. Jednotlivé kroky řešení často konzultoval, dodržoval dohodnuté termíny a na konzultace byl vždy připraven. Na mé zprávy reagoval rychle a zpětnou vazbu zapracovával.

Aktivita při dokončování

Práce byla dokončena včas, obsah byl řádně konzultován a student mé připomínky zohlednil.

Publikační činnost, ocenění

Points proposed by supervisor: 80
Display more

Grade proposed by supervisor: B

Reviewer’s report
Ing. Jiří Hynek, Ph.D.

Student splnil zadání. Výstupy jsou využitelné v praxi a pro další výzkum. Navrhuji hodnocení stupněm C.

Evaluation criteria Verbal classification Points
Náročnost zadání

Evaluation level: průměrně obtížné zadání

Cílem práce bylo navrhnout a implementovat nástroj pro obecnou transformaci datových sad reprezentujících záznamy hlasování městských zastupitelstev do modelu navrženého v rámci diplomové práce Kristýny Zaklové [1]. Student navrhl metamodel pro popis transformačních pravidel, ktera jsou definována v převážně deklarativní formě. Dále v jazyce Python implementoval nástroj, který dle dodaných pravidel provede transformaci. Zadání hodnotím jako průměrně obtížné.

ZAKLOVÁ, Kristýna. Analýza a vizualizace dat z hlasování Zastupitelstva města Brna. Brno, 2023. Diplomová práce. Vysoké učení technické v Brně, Fakulta informačních technologií. Vedoucí práce: Ing. Jiří Hynek, Ph.D.

Prezentační úroveň technické zprávy

Text je rozumně rozčleněn na teoretickou část pojednávající o práci zastupitelstev a porozumění datům. Praktická část představuje analýzu, návrh, implementaci a testování nástroje. Popis implementace na mě působí chaotickým dojmem.

70
Formální úprava technické zprávy

Formální úroveň technické zprávy je na přijatelné úrovni. Místy chybí čárky, oddělovače nebo přebývají mezery.

85
Realizační výstup

Výstupem je skript v jazyce Python, který podporuje zpracování dat ve formátu JSON, CSV a XML. Funkčnost byla testována na datových sadách města Děčín, Karviná, Most a Praha. Pro dobrou použitelnost nástroje budou do budoucna vyžadovány některé další úpravy, nicméně lze konstatovat, že řešení naplňuje požadavky bakalářské práce.

75
Využitelnost výsledků

Výsledky budou využity v projektu zastupko.cz.

Rozsah splnění požadavků zadání

Evaluation level: zadání splněno

Rozsah technické zprávy

Evaluation level: je v obvyklém rozmezí

Práce s literaturou

Student prostudoval dostatečné množství zdrojů. Některé citace představují pouze referenci na domovské stránky projektů.

85
Topics for thesis defence:
  1. Velké množství dostupných datových sad je ve formátu HTML. Jak byste zajistil podporu tohoto formátu?
  2. Definice vlastních funkcí pro zpracování dat je nyní psaná do souboru ve formátu JSON, což je značně nepraktické. Jak by bylo možné řešení vylepšit?
Points proposed by reviewer: 75
Display more

Grade proposed by reviewer: C