Přístupnostní navigace
E-přihláška
Vyhledávání Vyhledat Zavřít
studijní program
Fakulta: FITZkratka: DIT-ENAk. rok: 2024/2025
Typ studijního programu: doktorský
Kód studijního programu: P0613D140029
Udělovaný titul: Ph.D.
Jazyk výuky: angličtina
Akreditace: 8.12.2020 - 8.12.2030
Profil programu
Akademicky zaměřený
Forma studia
Kombinované studium
Standardní doba studia
4 roky
Garant programu
prof. Ing. Lukáš Sekanina, Ph.D.
Oborová rada
Předseda :prof. Ing. Lukáš Sekanina, Ph.D.Člen interní :doc. Ing. Jan Kořenek, Ph.D.prof. Dr. Ing. Jan Černockýprof. Ing. Adam Herout, Ph.D.prof. Ing. Tomáš Hruška, CSc.doc. Dr. Ing. Petr Hanáčekprof. Dr. Ing. Pavel Zemčík, dr. h. c.prof. RNDr. Alexandr Meduna, CSc.prof. Dr. Ing. Zbyněk Raidaprof. RNDr. Josef Šlapal, CSc.prof. Ing. Pavel Václavek, Ph.D.prof. Ing. Tomáš Vojnar, Ph.D.Člen externí :prof.,RNDr. Jiří Barnat, Ph.D.
Oblasti vzdělávání
Cíle studia
Cílem studijního programu je poskytnout vynikajícím absolventům magisterského studia specializované univerzitní vzdělání nejvyššího typu v informatice a výpočetní technice, zvláště pak v oblastech, ve kterých se profilují výzkumné skupiny FIT, a ve vztahu k výzkumným projektům řešeným na FIT:
Profil absolventa
Absolventi doktorského studijního programu Information Technology jsou schopni samostatně provádět vědecko-výzkumnou činnost a tvůrčím způsobem řešit složité teoretické, návrhové, verifikační, testovací, implementační a inovační problémy v oblasti informatiky. Jsou vybaveni pokročilými znalostmi jak z teoretické informatiky, tak i z oblasti algoritmizace, tvorby software i hardware a zkušenostmi s jejich uplatněním v různých aplikacích. Hlavní důraz a cíl studia je směřován na vědeckou a tvůrčí činnost a představení výstupů této činnosti vědecké komunitě na mezinárodní úrovni, zejména ve formě publikačních výstupů. Další nedílnou součástí je získání zkušeností s prací v týmu a pravidelná prezentace dosažených výsledků, nejdříve pro kolegy na FIT a později na mezinárodních vědeckých konferencích. Absolventi doktorského studijního programu mají tedy nejen teoretické a specializované znalosti dle svého odborného zaměření, ale zároveň i zkušenosti s publikační činností a uplatněním a prezentací výsledků na mezinárodní úrovni.
Charakteristika profesí
Absolventi FIT obecně a absolventi doktorského studia zejména nemají problém najít uplatnění jako vědečtí, pedagogičtí či řídicí pracovníci jak v ČR tak v zahraničí.
Podmínky splnění
Jsou vymezeny individuálním studijním plánem studenta, jenž specifikuje studijní předměty, které je student povinen úspěšně absolvovat, předpokládané stáže a účasti na odborných konferencích a minimální pedagogické působení v bakalářském nebo magisterském studijním programu fakulty. Úspěšné ukončení studia je podmíněno:
Vytváření studijních plánů
Jsou stanovena směrnicí děkana Pravidla o organizaci studia na FIT pro sestavovaní individuálního plánu studenta. Individuální studijní plán vychází z tématu disertační práce a podléhá schválení oborovou radou.Předepisuje:
https://www.fit.vut.cz/fit/info/smernice/sm2018-13.pdf
Dostupnost pro zdravotně postižené
Vysoké učení technické v Brně umožňuje studium osobám se zdravotním postižením dle § 21, odst. 1 písm. e) zákona 111/1998 Sb. vysokých školách a o změně a doplnění dalších zákonů ve znění pozdějších předpisů a dle požadavků v této oblasti vyplývajících z nařízení vlády č. 274/2016 Sb., o standardech pro akreditace ve vysokém školství, poskytuje uchazečům o studium a studentům se specifickými potřebami služby v rozsahu a formou odpovídající specifikaci uvedené v Příloze č. 3 k Pravidlům pro poskytování příspěvku a dotací veřejným vysokým školám Ministerstvem školství, mládeže a tělovýchovy, specifikující financování zvýšených nákladů na studium studentů se specifickými potřebami.Služby pro studenty se specifickými potřebami jsou na VUT v Brně realizovány prostřednictvím aktivit specializovaného pracoviště - poradenského centra Alfons, které je součástí Institutu celoživotního vzdělávání VUT v Brně - sekce Poradenství pro studenty.Aktivity poradenského centra a pravidla zpřístupňování studia univerzita garantuje platnou Směrnicí rektora č. 11/2017 upravující postavení uchazečů o studium a studentů se specifickými potřebami na VUT v Brně. Tato vnitřní norma garantuje minimální standardy poskytovaných služeb.Služby poradenského centra jsou nabízeny uchazečům o studium a studentům se všemi typy zdravotního znevýhodnění uvedených ve zmíněném Metodickém standardu Ministerstva školství, mládeže a tělovýchovy.
Návaznost na další typy studijních programů
Studijní program navazuje jak na dobíhající navazující magisterský program Informační technologie, tak na nový navazující magisterský program Informační technologie a umělá inteligence.Studenti mohou dále, podle svých potřeb a mimo své formalizované studium, také absolvovat kurzy a školení týkající se metodologie vědecké práce, publikačních a citačních dovedností, etiky, pedagogiky a tzv. měkkých dovedností, které organizuje VUT či jiné instituce.
Vypsaná témata doktorského studijního programu
Veľké jazykové modely (LLM) predstavujú silný nástroj, ktorý dokáže podporovať širokú škálu downstream úloh. Dajú sa použiť napr. v pokročilých konverzačných rozhraniach alebo v rôznych úlohách zahŕňajúcich vyhľadávanie, klasifikáciu, generovanie a ďalšie. K takýmto úlohám možno pristupovať prostredníctvom in-context učenia v zero-shot alebo few-shot režime alebo prostredníctvom dolaďovania (angl. fine-tuning) LLM na väčších dátových množinách (kvôli zníženiu požiadaviek na pamäť a diskový priestor zvyčajne pomocou techník PEFT (z angl. parameter-efficient fine-tuning)). Napriek ich bezprecedentným výsledkom na mnohých úlohách trpia LLM niekoľkými významnými obmedzeniami, ktoré v súčasnosti v mnohých doménach bránia ich bezpečnému a širokému použitiu. Tieto obmedzenia zahŕňajú napr. tendenciu generovať odpovede, ktoré nemajú oporu v tréningovom korpuse alebo vstupnom kontexte (halucinácie), ťažkosti pri manipulácii s extrémne dlhými kontextami (napr. celé knihy) či obmedzenou schopnosťou využívať iné dátové modality, ako je obraz, kde majú state-of-the-art modely napr. problém rozpoznávať jemné vizuálne koncepty. Cieľom výskumu je preskúmať takéto obmedzenia a – po zameraní sa na jedno alebo dve z nich – navrhnúť nové stratégie na ich zmiernenie. Také stratégie môžu zahŕňať napr.: • Posun režimu generovania bližšie k prístupom využívajúcim vyhľadávanie (angl. retrieval-based) a k neparametrickým jazykovým modelom; • Rozšírenie modelov o samoopravné mechanizmy či samohodnotiace pipeline-y; • Efektívna podpora pre dlhé kontexty; • Úplnejšie využitie multimodality, najmä v kontexte kombinácie obrazových a jazykových dát; vysetliteľnostná analýza modelov a návrh nových mechanizmov tréningu podporujúcich schopnosť rozpoznávať aj jemné vizuálne koncepty; • Nové techniky dolaďovania (angl. fine-tuning); • Zlepšenie a širšie využitie schopností LLM robiť logické odvodzovanie. Aplikačnou doménou môže byť napr. Podpora overovania faktov a boja proti dezinformáciám, kde je faktualita výstupov LLM absolútne kritická. Súvisiace publikácie: • Srba, I., Pecher, B., Tomlein, M., Moro, R., Stefancova, E., Simko, J. and Bielikova, M., 2022, July. Monant medical misinformation dataset: Mapping articles to fact-checked claims. In Proceedings of the 45th International ACM SIGIR Conference on Research and Development in Information Retrieval (pp. 2949-2959). https://dl.acm.org/doi/10.1145/3477495.3531726 • Pikuliak, M., Srba, I., Moro, R., Hromadka, T., Smolen, T., Melisek, M., Vykopal, I., Simko, J., Podrouzek, J. and Bielikova, M., 2023. Multilingual Previously Fact-Checked Claim Retrieval. https://arxiv.org/abs/2305.07991 Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín v rámci medzinárodných výskumných grantov. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer v KInIT.
Školitel: Gregor Michal, doc. Ing., Ph.D.
Nasazování umělé inteligence v rámci bezpečnostních aplikací se stává moderním fenoménem. Veřejné kamerové systémy poskytují dostatek kvalitních dat pro analýzu a poskytování informací v reálném čase s cílem zvyšovat úroveň bezpečnosti. Cílem této práce je vytvořit řešení, které bude schopné rozlišovat jednotlivé osoby a analyzovat jejich chování v reálném čase. V případě nestandardního chování bude uživatel upozorněn.
Očekává se účast na relevantních mezinárodních konferencích a publikování v odborných či vědeckých časopisech. Dále předpokládáme spolupráci se zástupci policie; nicméně pro plnění výzkumu to není nezbytná podmínka.
Na vedení práce se bude podílet školitel specialista Dr. Filip Orság.
Školitel: Hanáček Petr, doc. Dr. Ing.
Tematicky se tato disertační práce orientuje na bezpečnost bezdrátových lokálních sítí. V rámci řešení by mělo dojít k seznámení se s vybranými bezdrátovými sítěmi a jejich zabezpečením. Kroky práce by měly obsahovat: prostudování teorie bezdrátových sítí, jejich vlastností a možností provedení útoků, odzkoušení základních typů útoků, navržení nového způsobu ochrany, experimenty, zhodnocení výsledků a návrh směru dalšího výzkumu.
Očekává se účast na relevantních mezinárodních konferencích a publikování v odborných či vědeckých časopisech.
Na vedení práce se bude podílet školitel-specialista dr. Kamil Malinka.
V posledních letech došlo obrovskému zvýšení kvality výstupů neuronových sítí generující syntetický obsah, které šlo ruku v ruce s výrazným zjednodušením použití nástrojů využívajících AI a také jejich vyšší dostupností. Rostoucí trend v používání umělé inteligence tak přináší nové výzvy oblasti kybernetické bezpečnosti. Nejvýznamnějšími příklady je použití tzv. "deepfakes" k útoku na biometrické systémy nebo využití technik hlubokého učení k detekci kybernetických útoků. Cílem této práce je ve vybrané oblasti kybernetické bezpečnosti analyzovat nové trendy, přístupy, reálné útoky, jejich vlastnosti, dopady a potenciální aplikace. Práce by poté měla na základě analýzy a výzkumu stavu bezpečnosti pro vybrané oblasti navrhnout nové metody ochrany založené na AI.
Doporučené oblasti zaměření práce:Vliv generativní AI na bezpečnost kódu a aplikační bezpečnostLidský faktor v útocích založené na AI - např. zvyšování schopnosti lidí rozpoznávat tento typ útokůDopady generativní AI na bezpečnost biometrické autentizace (hlas, obličej, ...)
Výzkumný problém: Mezi všemi typy demence je Alzheimerova choroba (AD) nejběžnější formou, přičemž 70 % lidí postižených demencí má AD. Vzhledem k tomu, že prevalence AD se zvyšuje s věkem, očekává se, že počet lidí žijících s AD v příštích desetiletích poroste v důsledku lepší kvality života, která má za následek zvýšení věku v mnoha zemích. To vše vedlo ke zvýšenému zaměření na zajištění pre-start detekce AD a odpovídající intervenci, což může vést ke zpomalení progrese onemocnění poskytnutím adekvátní diagnostiky.
Problémy se současnými řešeními: K preklinické AD dochází 10 až 15 let před vypuknutím nemoci, což má za následek změny v mozku, aniž by se projevily nějaké skutečné příznaky nemoci, jako je ztráta paměti atd. Pre-onset znamená detekci AD v preklinickém stádiu nebo před ním. Stávající nejmodernější metody se zaměřují především na detekci pozdějších stádií AD a detekce preklinické AD je stále otevřeným výzkumným problémem. Tento výzkum se proto zaměřuje na detekci AD před propuknutím (tj. včasnou detekci preklinické AD), protože to bude mít obrovský dopad na životy lidí. To může vést k včasnému zásahu a může vést k dalšímu zpomalení progrese onemocnění.
Výzvy: Ve fázi preklinické AD nejsou související příznaky a symptomy jasné, a proto lidé v této fázi nevyhledávají žádnou pomoc. Proto by metoda pro detekci AD před nástupem měla být součástí pravidelného procesu zdravotního screeningu, a proto by měla být dostupná v malých klinických zařízeních.
Téma práce: Způsob detekce preklinické AD bude zahrnovat zkoumání základních mozkových mechanismů pro sledování a sledování změn souvisejících s pre-propuknutím detekce AD. Zobrazování magnetickou rezonancí (MRI) bude použito jako reference pro zkoumání dynamiky mozku, ale v praxi jej nelze použít kvůli jeho vysoké ceně a specializovanému prostředí, které omezuje jeho použití ve fázi screeningu. V tomto výzkumu bude použit elektroencefalogram (EEG), který je široce dostupný, má nízkou cenu, má dobré časové rozlišení a má vysokou mobilitu. Proto si tento projekt klade za cíl prozkoumat změny v základních mozkových mechanismech pomocí EEG k vývoji neuromarkeru založeného na EEG pro detekci AD před propuknutím. Neuromarker bude zahrnovat extrakci funkcí a odpovídající vývoj modelu strojového učení.
Pár slov o školiteli: Dr. Malik nedávno nastoupil na FIT VUT v Brně. Má desetiletou zkušenost s prací v oblasti zpracování neuro-signálů a neuro-obrazu. V současné době je v procesu zakládání výzkumné skupiny v této oblasti na FIT. Jedná se o multidisciplinární projekt, který bude zahrnovat spolupráci s klinickými lékaři. Jádro projektu však souvisí s IT. Jedná se o vývoj nové metody analýzy EEG signálů. Neváhejte mě kontaktovat na malik@fit.vutbr.cz
Školitel: Malik Aamir Saeed, prof., Ph.D.
Práce začne seznámením se základy problematiky detekce hlasů deepfakes (deepfake detection, DFD) - s terminologií, dostupnými technikami, daty a mezinárodními evaluacemi výzvami (zejména AVSpoof), s historií a současným stavem technik a nástrojů pro rozpoznávání mluvčích (wespeaker toolkit), se současným stavem technik a nástrojů pro personalizovanou syntézu textu na řeč (pTTS) a převod hlasu. Prvním úkolem bude reprodukovat jeden nebo dva systémy DFD z AVSpoof 2021 (nebo novější evaluace), zkontrolovat, zda čísla odpovídají tomu, co je uváděno, prostudovat, jak systémy fungují, a následně napadnout systém(y) DFD AVSpoof 2021 pomocí několika aktuálních technik generování DFD. Hlavním úkolem PhD práce je navrhnout a implementovat způsoby, jak detekovat DFD (nebo napomoci detekci DFD) například tím, že (1) systém DFD bude znát pravou řeč cílového mluvčího (2) bude pracovat s artefakty, které by mohly být špatně zpracovány systémy pTTS, jako jsou například nádechy. (3) návrhem a implementací technik využívajících poznatky psychoakustiky (4) návrhem a implementací technik využívajících textové informace dostupné od cílového mluvčího (např. sociální sítě)..
Školitel: Černocký Jan, prof. Dr. Ing.
Různé typy logik a automatů patří mezi nejzákladnější objekty studované a aplikované v oblasti informatiky již desítky let. Přesto v této oblasti existuje řada dosud neuspokojivě vyřešených problémů a neustále se objevují nové, vzrušující problémy související se stále novými aplikacemi logik a automatů (např. při formální verifikaci konečně i nekonečně stavových systémů s různými pokročilými řídicími či datovými strukturami, v rozhodovacích procedurách, při syntéze programů či hardware nebo i v metodách efektivního vyhledávání v různých typech dat či v síťovém provozu). Předmětem disertační práce bude primárně rozvoj současného stavu v oblasti efektivní práce s různými logikami (např. nad ukazatelovými strukturami, řetězci, různými aritmetikami, temporálními logikami apod.). Za tím účelem budou zkoumány přístupy založené na různých typech rozhodovacích diagramů, automatů, ale také např. přístupy založené na existenci modelu omezené velikosti či na efektivních redukcích mezi různými typy logických teorií. V souvislosti s tím pak budou rozvíjeny i metody efektivní práce s rozhodovacími diagramy a různými typy automatů (automaty nad slovy, stromy, nekonečnými slovy, automaty s čítači apod.). Práce zahrne jak teoretický výzkum, tak také prototypovou implementaci navržených technik a jejich experimentální vyhodnocení. Práce bude řešena ve spolupráci s týmem VeriFIT zabývajícím se na FIT VUT rozvojem technik pro práci s logikami a automaty a jejich aplikacemi. Jedná se zejména o dr. O. Lengála, jež bude působit v roli školitele specialisty, nebo také doc. L. Holíka či doc. A. Rogalewicze. V případě zodpovědného přístupu a kvalitních výsledků je zde možnost zapojení do grantových projektů (včetně mezinárodních). Je zde rovněž možnost úzké spolupráce s různými zahraničními partnery VeriFIT: Academia Sinica, Tchaj-wan (prof. Y.-F. Chen); TU Vienna, Rakousko (doc. F. Zuleger); LSV, ENS Paris-Saclay (prof. M. Sighireanu); IRIF, Paříž, Francie (prof. A. Bouajjani, doc. P. Habermehl, doc. C. Enea), Verimag, Grenoble, Francie (doc. R. Iosif); Uppsala University, Švédsko (prof. P.A. Abdulla, prof. B. Jonsson); či School of Informatics, University of Edinburgh, Velká Británie (prof. R. Mayr). V rámci tématu se student může také aktivně zapojit do různých grantových projektů, jako jsou např. projekty GA ČR GA23-07565S "ROULETTE - Reprezentace Booleovských funkcí pomocí adaptabilní datové struktury", GA23-06506S "AIDE - Pokročilá analýza a verifikace pro pokročilý software", ERC.CZ projekt LL1908 "Efektivní konečné automaty pro automatické usuzování" či některý z aktuálně připravovaných Horizon Europe projektů.
Školitel: Vojnar Tomáš, prof. Ing., Ph.D.
Téma je zaměřeno na algoritmy embedded zpracování obrazu, videa a/nebo signálu. Hlavním cílem je zkoumat možnosti "chytrých" a "malých" zařízení, která by měla nové vlastnosti, a bylo možné je efektivně nasadit do aplikací vyžadujících malé, skryté, distribuované, nízkopříkonové, mechanicky nebo klimaticky namáhané jednotky schopné zpracovávat signálové vstupy. Nasazení takových jednotek je perspektivní a široké a předpokládá se i propojení do klient/server a/nebo cloud systémů. Samotné jednotky mohou být založeny na efektivním CPU/GPU/DSP, na programovatelném hardware, případně na kombinaci těchto technologií. Může se jednat i o smart kamery. Aplikace, které jsou v oblasti zájmu tohoto tématu:
Je možnost spolupráce i na grantových projektech, zejména na nově podávaných projektech TAČR, H2020, ECSEL (potenciálně možnost stipendia či pracovního poměru).
Školitel: Zemčík Pavel, prof. Dr. Ing., dr. h. c.
Ukazuje se, že metody syntézy číslicových obvodů využívající evolučních algoritmů, zejména kartézského genetického programování pracujícího přímo nad reprezentací na úrovni hradel, jsou schopny produkovat implementace, které jsou v řadě případů mnohem efektivnější (typicky kompaktnější) nežli implementace získané pomocí současných syntézních technik využívajících interní reprezentace (např. AIG) a iterativní aplikace deterministických přepisovacích pravidel. Typickým cílem optimalizace je redukovat počet hradel optimalizovaného obvodu. V praxi se však vyskytuje požadavek optimalizovat obvod z hlediska více kriterií (např. zpoždění, plocha na čipu). V případě využití systému pro účely resyntézy je multikriteriální optimalizace nutností z důvodu zachování zpoždění obvodu, jehož část je předmětem optimalizace. Cílem disertační práce je navázat na předchozí výzkum a zabývat se možnostmi multikriteriální optimalizace číslicových obvodů s ohledem na dobrou škálovatelnost. Dále se předpokládá využití alternativních reprezentací jako je např. majority uzel, které lépe odrážejí principy nových technologií.Výzkum spadá do témat řešených výzkumnou skupinou Evolvable Hardware.
Školitel: Vašíček Zdeněk, doc. Ing., Ph.D.
Problematika identifikace a extrakce konkrétních informací z dokumentů na WWW je již delší dobu předmětem intenzivního výzkumu. Mezi základní překážky, které je třeba překonat, patří nedostatečná strukturovanost HTML dokumentů a absence metainformací (anotací) využitelných pro rozpoznání významu jednotlivých částí obsahu. Tyto chybějící informace jsou proto nahrazovány analýzou různých aspektů webových dokumentů, zejména následujících:
Pro úspěšnou extrakci konkrétní informace z dokumentů je rovněž nezbytná doménová znalost zahrnující očekávanou strukturu extrahované informace (vztahy mezi jednotlivými extrahovanými položkami) a způsob zápisu jednotlivých položek. Tato znalost umožňuje přesnější rozpoznání jednotlivých částí informace v textu dokumentu.
Současné přístupy k extrakci informací z webových dokumentů se soustřeďují zejména na modelování a analýzu dokumentů samotných; modelování extrahované informace za účelem jejího přesnějšího rozpoznání nebylo dosud podrobněji zkoumáno v tomto kontextu. Předpokládaným cílem disertační práce jsou proto následující:
Nedílnou součástí je rovněž experimentální implementace navržených metod s využitím existujících nástrojů a experimentální ověření na reálných dokumentech dostupných na WWW.
Školitel: Burget Radek, doc. Ing., Ph.D.
Tématem disertační práce jsou zejména pokročilé metody zpracování a editace obrazu a generativní metody umělé inteligence pro syntézu obrazu. Cílem práce je výzkum nových metod s využitím strojového učení, zejména hlubokých neuronových sítí.
Školitel: Čadík Martin, doc. Ing., Ph.D.
Prohlášení o problému: Duševní stres, úzkost a deprese jsou stavy duševního zdraví, které se často vyskytují společně. V takovém případě je člověk ve stresu a není schopen obavy ovládat, a to odpovídajícím způsobem ovlivňuje jeho sociální a pracovní aktivity. Proto je nutné řádné posouzení a diagnostika duševního stresu, úzkosti a deprese, aby se člověk mohl efektivně podílet na svých běžných denních úkolech a činnostech.
Problémy se současnými řešeními: Bohužel konvenční hodnotící a diagnostická opatření jsou subjektivní povahy a používají se pouze tehdy, jsou-li symptomy již zjevné v důsledku pokročilého stádia duševního stresu, úzkosti a deprese. Psychický stres, úzkost a deprese však nevznikají přes noc, spíše jde o dlouhodobý proces. Detekce příznaků je tedy vyžadována v raných fázích duševního stresu, úzkosti a deprese, protože to může vést k vyléčení nebo alespoň oddálit nástup vážných duševních problémů s nimi spojených.
Výzvy: Na rozdíl od jiných nemocí, kde příznaky jako horečka a kašel umožňují lidem vyhledat pomoc, příznaky v raných fázích duševního stresu a úzkosti nejsou snadno identifikovatelné. Proto je třeba, aby byl mozek neustále sledován, zda se u něj neobjevují žádné známky změny nebo zhoršení, aby se příznaky odhalily v raném stádiu.
Řešení: Řešení spočívá ve vývoji objektivní a kvantitativní metody, která dokáže odhalit duševní stres, úzkost a depresi v raném stadiu. Vnímání duševního stresu, úzkosti a deprese má původ v mozku; proto tento výzkum zkoumá neurofyziologické rysy extrahované ze signálu mozkového elektroencefalogramu (EEG) k měření duševního stresu, úzkosti a deprese v raném stádiu. To bude vyžadovat vývoj metody pro extrakci prvků a také přístup k rozpoznávání vzorů, aby bylo možné poskytnout řešení. Pro tento projekt je již k dispozici datový soubor EEG.
Pár slov o supervizi: Mám rozsáhlé zkušenosti s prací v oblasti zpracování neuro-signálů a neuroobrazu a v současné době jsem vedoucím výzkumné skupiny v této oblasti. Jedná se o multidisciplinární projekt a bude zahrnovat spolupráci s klinickými lékaři. Jádro projektu však souvisí s IT z hlediska vývoje nové metody. Neváhejte mě kontaktovat na malik@fit.vutbr.cz
Řešení tohoto projektu bude vycházet ze stávajících poznatků o moderních formálních modelech, které se používají v teorii jazyků. Teoretický výzkum těchto modelů bude diskutovat užitečné transformace těchto modelů, jako např. eliminace vymazávajících pravidel či redukce velikosti jejich komponent. Výzkum aplikací takto transformovaných modelů se bude soustředit na oblasti informatiky související s překladači, matematickou lingvistikou a molekulární biologií.
Výsledky prvního roku řešení tohoto problému budou publikovány v Acta Informatica v 2024.
Školitel: Meduna Alexandr, prof. RNDr., CSc.
Konverzační agenti se pomalu stávají běžnou součástí rozhraní pro (prvotní) komunikaci se zákazníkem a odpovídání na jeho otázky. Výzkum v oblasti počítačového zpracování přirozeného jazyka se zaměřuje na vytvoření automatické klasifikace prvotní komunikace a, zejména, otázky uživatele, do předem daných tříd, k nimž existují konkrétní texty. Není však uspokojivě vyřešeno rozšiřování "znalostí" komunikačních agentů při aktualizaci strukturovaných dat, případně při přidání dalších textových materiálů.Cílem disertační práce je rozvinout existující přístupy využívající obrovské kolekce neanotovaných textových dat a způsoby kombinování strukturované a nestrukturované znalosti a optimalizace procesů při rozšiřování funkcionality stávajících i nových konverzačních agentů. Součástí práce bude i aplikace zkoumaných metod v rámci evropských projektů, na jejichž řešení se školitel podílí.
Školitel: Smrž Pavel, doc. RNDr., Ph.D.
Tématicky se tato disertační práce orientuje na bezpečnost IoT systémů. Práce by měla obsahovat:
S nástupom veľkých jazykových modelov (LLM) vyvstávajú výskumné otázky ako merať kvalitu a vlastnosti ich výstupov. Tieto merania sú dôležité pre porovnávanie a vylepšovanie modelov či ladenie ich vstupov (prompts). Niektoré techniky vyhodnocovania sa vzťahujú k špecifickým doménam a scenárom použitia (napr. ako presne model odpovedá na faktické otázky v konkrétnej doméne? ako dobre sa dajú generované príklady použiť na trénovanie malého modelu na konkrétnu úlohu?). Iné techniky sú všeobecnejšie (napr. aká je rozmanitosť parafráz generovaných LLM? ako jednoduché je detegovať, že je obsah generovaný?).
Prostredníctvom replikačných štúdií, porovnávacích experimentov, návrhov metrík, konštrukcie vstupov a iných prístupov, doktorand/ka posunie poznanie v metódach a experimentálnych metodológiách vyhodnocovania výstupov veľkých jazykových modelov. Za pozornosť pritom stoja dva všeobecné scenáre:
Doktorand/ka si vyberie jeden z uvedených scenárov (no nebude ním obmedzený/á) a ďalej ho rozpracuje a primerane zúži na špecifické výskumné otázky, ktoré experimentálne overí.
Súvisiace publikácie:
Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.
Školitel: Šimko Jakub, doc. Ing., PhD.
V poslední době se stává čím dál patrnější, že k překlenutí propasti mezi současnými nejlepšími modely strojového učení a lidským učením nestačí jen zvyšovat počty parametrů a čekat na výkonnější hardware, který zvládne zpracování bilionů parametrů. Zdá se, že je třeba hledat nové modely, schopné objevovat a uvažovat na úrovni vysokoúrovňových pojmů a vztahů mezi nimi.Cílem disertační práce je výzkum nových modelů strojového učení, které překonají potřebu enormního množství příkladů, které jsou potřeba pro naučení chování, zvládnutelného lidmi velmi rychle (například počítač potřebuje sehrát velké množství her ke zvládnutí jednoduché videohry, zatímco člověk to zvládne velmi rychle, lidé ze sady proměnných rychle určí, jaká je příčinná souvislost mezi nimi, dokáží argumentovat sledem úvah atd.), a omezí problém sebejistého chybování (overconfident incorrectness) současných modelů. Budou zkoumány postupy učení, přidávající iterativně nové relevantní informace a také metody, podporující přímé pravděpodobnostní odvozování. Výsledky budou demonstrovány na vybraných problémech, zahrnujících mj. vysvětlování videa či tvorbu inferenčních grafů, operujících nad pojmy a vztahy mezi nimi.
Tématem jsou algoritmy počítačové grafiky a syntézy obrazu. Hlavním cílem je zkoumat nové a moderní algoritmy počítačové grafiky, související datové struktury, související otázky získávání a zpracování 3D modelů a další aspekty algoritmů tak, aby bylo lépe rozumět jejich vlastnostem a možnostem, zlepšovat a připravovat nové. Je možno pracovat na různých platformách, včetně paralelních CPU jáder x86/64, ARM, Xeon PHI, GPU apod. v OpenCL, CUDA, v FPGA ve VHDL, případně i jinak. Možné algoritmy zahrnují:
Po dohodě je možné zpracovávat i individuálně vybrané algoritmy, které ve výše uvedeném seznamu nejsou, ale patří do dané tématiky.
Je možnost spolupráce i na grantových projektech, zejména na nově podávaných projektech TAČR, H2020, ECSEL (možnost stipendia či pracovního poměru).
Cílem práce je seznámit se s aktuálními problémy počítačového vidění a používaného strojového učení (hluboké konvoluční neuronové sítě) a identifikovat zajímavé problémy k rozvinutí a dalšímu výzkumu. Řešitel má získat nadhled v problematice a experimentovat s populárními algoritmy a identifikovat jejich vhodné okrajové případy, na kterých bude možné dosáhnout zajímavých výsledků a pokroků.Konkrétně se řešitel má zaměřit na následující:
Školitel: Herout Adam, prof. Ing., Ph.D.
Řešení tohoto projektu bude vycházet ze stávajících poznatků o metodách překladu jazyků a poznatků o systémech formálních modelů, zejména překladových gramatik a automatů. Cílem je konstrukce a výzkum metod překladů založených na takovýchto systémech a to tak, aby nové metody adekvátním způsobem odrážejí potřeby moderních kompilátorů. Aplikace těchto systémů se budou soustředit na překladače.
Výzkumný problém: Význam duševního zdraví v posledním desetiletí výrazně vzrostl. Metody pro hodnocení problémů duševního zdraví v raných stádiích jsou však stále v plenkách ve srovnání s dostupností odpovídajících metod pro včasné hodnocení problémů fyzického zdraví. Je tedy nutné, aby byl proveden patřičný výzkum s cílem vyvinout metody pro včasné hodnocení abnormalit vedoucích k problémům duševního zdraví.
Problémy se současnými řešeními: Na rozdíl od fyzického zdraví se duševní zdraví posuzuje prostřednictvím řady subjektivních parametrů. Proto chybí objektivní a kvantitativní metody pro hodnocení duševního zdraví. Navíc pacienti vyhledávají pomoc, až když je jejich duševní problém v pokročilé fázi. Chybí tedy nepřetržité sledování jejich duševního zdraví.
Výzvy: Mnoho abnormalit souvisejících s problémy duševního zdraví se jen nepatrně projevuje a souvisí s chováním a dalšími změnami ve výrazech obličeje, řeči a rukopisu. Kromě toho dochází ke změnám hladiny kortizolu, kožní vodivosti, variability srdeční frekvence a frekvence dýchání. Existuje tedy několik modalit, které by měly být zahrnuty pro měření a kvantifikaci jakýchkoli abnormalit souvisejících s duševním zdravím.
Téma práce: Každá modalita má své pro a proti. Například v neurozobrazování má funkční magnetická rezonance vysoké prostorové rozlišení (v mm) a nízké časové rozlišení (v sekundách), zatímco elektroencefalogram má nízké prostorové rozlišení (v cm) a vysoké časové rozlišení (v milisekundách). Kombinace obou povede k vysokému prostorovému i vysokému časovému rozlišení. Výzkum se bude zabývat hodnocením abnormalit vedoucích k problémům duševního zdraví pomocí multimodálního přístupu. Různé modality mohou mimo jiné zahrnovat mozkové signály elektroencefalogramu (EEG), obličejová videa, zvuk řeči, rukopis a text ze sociálních médií. Mezi fyziologické parametry z různých modalit patří mimo jiné srdeční frekvence, frekvence dýchání, dominantní emoce, únava a stres. Dominantní emoce mohou být klasifikovány jako pozitivní nebo negativní a poté podřazeny jako smutné, šťastné, naštvané atd. Pro tuto multimodální analýzu budou vyvinuty techniky dolování dat a fúze dat. Pro tento projekt jsou k dispozici odpovídající multimodální data.
Pár slov o školiteli: Mám rozsáhlé zkušenosti s prací v oblasti zpracování neuro-signálů a neuroobrazu a v současné době jsem vedoucím výzkumné skupiny v této oblasti. Jedná se o multidisciplinární projekt a bude zahrnovat spolupráci s klinickými lékaři. Jádro projektu však souvisí s IT z hlediska vývoje nové metody. Neváhejte mě kontaktovat na malik@fit.vutbr.cz
Řešení tohoto projektu bude vycházet ze stávajících poznatků teorie formálních jazyků o modelech definující jazyky. Projekt se zaměří na automaty a gramatiky. Cílem je konstrukce a výzkum nových verzí těchto modelů a to tak, aby adekvátním způsobem odrážely potřeby moderní informatiky. Řešení projektu bude rovněž zahrnovat diskuzi aplikací těchto systémů např. v oblasti bezpečnosti.
Odporúčacie systémy sú integrálnou súčasťou prakticky každej modernej webovej aplikácie. Personalizované, resp. adaptívne služby, sa stali štandardom, ktorý je používateľmi aplikácií vyžadovaný skoro vo všetkých doménach (napr. spravodajstvo, četoví agenti, sociálne médiá alebo vyhľadávanie).
Personalizácia má významný vplyv na každodenný život miliónov používateľov naprieč mnohými doménami a aplikáciami. To je zdrojom zásadnej výzvy - návrh metód, ktoré sú nielen presné, ale aj dôveryhodné a spravodlivé. Táto výzva ponúka mnohé výskumné príležitosti vo viacerých smeroch:
Nové metódy strojového učenia pre adaptívne a odporúčacie systémy
Dôveryhodné metódy odporúčania pre viac-kritériové aplikácie
Vysvetľovanie odporúčaní
Férovosť a spravodlivosť v odporúčaní
Skreslenia v odporúčaní
Jednotlivé smery a výzvy môžu byť adresované vo viacerých doménach ako napríklad vyhľadávanie, elektronický obchod, spravodajstvo, sociálne médiá a iné.
Školitel: Kompan Michal, doc. Ing., PhD.
Cílem disertační práce je výzkum v oblasti tzv. generativní umělé inteligence - ať už se jedná o difusní a adversiální modely pro generování videa, generativní textové modely pro vytváření příběhů, automatické generování počítačového kódu, hudby, reprezentaci znalostí fyziky a chemie a podporu vědecké kreativity, případně kombinace všech těchto přístupů. Práce se zaměří na řešení problémů interakce člověka s generovanými mezivýsledky, přirozeného označování jednotlivých částí a konceptů tak, aby bylo možné na průběžné výsledky navazovat, a na vývoj metod úpravy datových sad a postupů učení, aby bylo možné řešit společenské problémy, spojené s vytvářenými kreativními modely - otázky spravedlivosti modelů, předpojatosti a začlenění konceptů tzv. zodpovědné umělé inteligence.
Tématem jsou algoritmy zpracování obrazu, videa a/nebo signálu. Hlavním cílem je zkoumat a do hloubky analyzovat příslušné algoritmy a hledat nové tak, aby měly nové potřebné vlastnosti, a bylo možné je efektivně implementovat. Taková efektivní implementace může , ale nemusí být součástí práce, ale důležité je algoritmy připravit tak, aby šly efektivně zpracovávat například v CPU, v CPU s akcelerací SSE instrukcemi, v embedded systémech, i v kombinaci s FPGA, v Intel Xeon PHI, v systémech s extrémně nízkým příkonem, případně v jiném prostředí. Je možné i využití algoritmů umělé inteligence, včetně neuronových sítí, zejména CNN. Důležité jsou též aplikační možnosti algoritmů s tím, že samotná aplikace může, ale nemusí být součástí řešení. Možné algoritmy/aplikace zahrnují:
Po dohodě je možné zpracovávat i individuálně vybrané téma, které ve výše uvedeném seznamu není, ale patří do dané tématiky.
Je možnost spolupráce i na grantových projektech, zejména na nově podávaných TAČR, MPO, H2020, SCSEL (potenciálně možnost stipendia či pracovního poměru).
Téma se zabývá pokročilými metodami syntézy obrazu. Cílem práce je výzkum nových metod pro fotorealistické (fyzikálně založené) i nefotorealistické (NPR) simulace světelné interakce ve scéně. Předpokládá se intenzivní spolupráce a stáže na špičkových institucích a firmách v oboru (Adobe, USA, MPII Saarbrücken, Německo, Disney Curych, Švýcarsko, INRIA Bordeaux, Francie).
Téma se zabývá pokročilými metodami výpočetní fotografie. Cílem práce je výzkum nových metod pro výpočetní fotografii, což zahrnuje zejména softwarové řešení, které může být případně dále kombinováno s novou optikou a dalším hardware. Mezi oblasti výzkumu patří zpracování HDR obrazu a videa, převod barevného obrazu na černobílý, spektrální obraz, pokročilé generování obrazu pomocí metod umělé inteligence a mnoho dalších.
Strojové učenie je v centre výskumu v oblasti umelej inteligencie. Témam spojeným so strojovým učením sa venuje množstvo výskumníkov v akademickom svete a aj v biznise v prestížnych vedeckých pracoviskách. Riešenia vedeckých výziev sa veľmi rýchlo dostávajú do praxe. Oblasť je veľmi dynamická.
Témy v tejto doméne definujú významné vedecké konferencie, na ktorých sa stretávajú výskumníci z celého sveta (rank A*) ako napríklad ICML (International Conference on Machine Learning), NeurIPS (Advances in Neural Information Processing Systems), IJCAI (International Joint Conference on AI), COLT (Conference on Learning Theory). Témy a ich špecializáciu budú viesť externí mentori.
Zaujímavé výskumné výzvy zahŕňajú témy (ale sa neobmedzujú takto):
Existuje veľa aplikačných domén, kde sa pokročilé metódy strojového učenia dajú využiť.
Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave pod vedením výskumníkov zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.
Školitel: Bieliková Mária, prof. Ing., Ph.D.
Rostoucí trend používání IT technologií přináší vzrůstající nároky na uživatele, kteří musí činit více a více rozhodnutí týkající se IT bezpečnosti. V rámci řešení práce by mělo dojít k seznámení se s bezpečnostními technikami a jejich použitelností pro uživatele. Cílem práce je zlepšit použitelnost vybraných bezpečnostních technik, aby byly účinné v praxi, a to s ohledem na znalosti lidského faktoru a principy designu zaměřeného na uživatele. Práce se bude zabývat především vnímáním nových technologií, jako je umělá inteligence, nebo měnícími se trendy v oblasti jedno- a vícefaktorové autentizace. Očekává se účast na relevantních mezinárodních konferencích a publikování v odborných či vědeckých časopisech.
Výzkumný problém: Cévní mozková příhoda je stav, kdy je omezen nebo zastaven přívod krve do mozku. Když pacient s cévní mozkovou příhodou dorazí do nemocnice, postupuje se podle standardního protokolu k poskytnutí lékařské pomoci pacientovi a také k posouzení vlivu cévní mozkové příhody na mozek. Obecně může následovat druhá mrtvice, která může být pro pacienta zničující. Proto je důležité předvídat další mrtvici a poskytnout péči, která může zabránit další mrtvici nebo alespoň minimalizovat její účinky.
Problémy se současnými řešeními: Standardní protokol v nemocnici zahrnuje testy krve a moči, stejně jako neuroimaging pomocí CT a MRI skenů. Tyto testy se používají k posouzení poškození způsobeného prvním úderem. Předpověď další mozkové příhody však závisí na zkušenostech lékaře a je velmi subjektivní. V mnoha případech pacient, který je po léčbě poslán domů, utrpí doma druhou devastující mozkovou příhodu, která může mít za následek trvalou invaliditu.
Výzvy: Standardní protokol v nemocnicích má za následek generování velkého množství dat, například stovky snímků z CT a MRI skenů, stovky enzymů z krevních a močových testů atd. Úkolem je kolektivně analyzovat všechna tato data a najít korelace, které může u pacienta předpovědět druhou mozkovou příhodu.
Téma práce: Tento výzkum vyvine metodu objektivní predikce výskytu druhé cévní mozkové příhody z dat shromážděných v nemocnici pomocí standardního protokolu pro hodnocení, léčbu a management cévní mozkové příhody. Analýza a vývoj bude zahrnovat techniky strojového učení, které zpracovávají multimodální data zahrnující obrázky, signály, text a čísla.
Pár slov o školiteli: Dr. Malik nedávno nastoupil na FIT VUT v Brně. Má desetiletou zkušenost s prací v oblasti zpracování neuro-signálů a neuro-obrazu. V současné době je v procesu zakládání výzkumné skupiny v této oblasti na FIT. Jedná se o multidisciplinární projekt, který bude zahrnovat spolupráci s klinickými lékaři. Jádro projektu však souvisí s IT. Jedná se o vývoj nové metody analýzy. Neváhejte mě kontaktovat na malik@fit.vutbr.cz
Zavedením sémantických operátorů do genetického programování umožnilo významně zefektivnit jeden ze základní stavebních pilířů evolučních výpočetních technik a zredukovat množství generací potřebných k nalezení řešení. Cílem disertační práce je navázat na předchozí výzkum a zabývat se možnostmi zavedení sémantických operátorů do kartézského genetického programování. Výzkum spadá do témat řešených výzkumnou skupinou Evolvable Hardware.
Modely vytvárané strojovým učením môžu byť len tak dobré, aké dobré sú dáta, ktoré použijeme na ich trénovanie. Aj preto sa výskumníci a inžinieri snažia získavať čo najlepšie trénovacie dáta. Nie je pritom zriedkavé vynakladať značné ľudské úsilie (pri čistení či anotovaní) s cieľom dosiahnuť potrebnú všeobecnú kvalitu. Niekedy je však ťažké, prípadne nemožné dostatočne pripraviť vzorku dát.
V takýchto prípadoch môžu pomôcť riešenia založené na princípe “človek v procese” (angl. human in the loop), ktorý využíva ľudské úsilie na vylepšovanie strojovo naučených modelov prostredníctvom ľudských zásahov priamo počas trénovania a/alebo počas nasadenia modelov (napr. spätná väzba pri automatickom preklade). Tieto riešenia sú špeciálne užitočné pri cielených zlepšeniach trénovacích dát prostredníctvom identifikácie a riešenia sporných prípadov.
Prístupy s človekom procese zahŕňajú pestrú paletu techník z oblastí ako aktívne a interaktívne učenie, ľudské počítanie či čerpanie z davu (spolu s motivačnými schémami ako gamifikácia a hry s účelom). S nástupom veľkých jazykových modelov sa tiež otvárajú možnosti využiť tieto techniky pri generovaní veľkých syntetických trénovacích sád s relatívne malým ľudským úsilím.
Aplikačné domény sú predovšetkým tie s veľkou mierou heterogenity a nestálosti. Takéto domény zahŕňajú napríklad aj detekciu falošných informácií, šírenie informácií online (vrátane šírenia naratívov a mémov), auditovanie algoritmov sociálnych médií a ich tendencií šíriť dezinformácie, podpora manuálneho/automatického overovania informácií (fact-checking) a ďalšie.
Přestože existují technologie, které umožňují publikovat data na WWW ve strojově čitelné podobě (jako např. JSON-LD, RDFa, apod.), velké množství strukturovaných dat je na webu stále publikováno ve formě prostého HTML/CSS kódu, který velmi omezuje možnosti jejich dalšího využití.V poslední době nabývají na významu nové metody strojového učení (zejména deep learning metody), které vykazují zajímavé výsledky např. při rozpoznávání důležitých entit ve slabě strukturovaných nebo nestrukturovaných datech (např. v textu nebo obraze). Oblasti zpracování webových dokumentů však není z tohoto pohledu věnována velká pozornost. Existující práce se zabývají identifikací jednoduchých datových položek a pomíjí strukturovaná data a komplexnější scénáře použití.Cílem tématu je proto analýza a vývoj modelů webového obsahu vhodných jako vstup pro strojové učení a současně i metod strojového učení vhodných pro rozpoznání strukturovaných dat ve webových dokumentech.
Řešení tohoto projektu bude vycházet ze stávajících poznatků o formálních modelech, zejména automatů a gramatik. Cílem je konstrukce a výzkum nových systemů automatů a gramatik, které adekvátním způsobem odrážejí potřeby moderních výpočetních metod založených na distribuci, kooperaci a regulaci. Kanonické a redukované verze těchto system budou centrem tohoto studia. Aplikace těchto systémů se budou soustředit na modelování a výzkum organismů v molekulární biologii a genetice.
Řešení tohoto projektu bude vycházet ze stávajících poznatků o moderních formálních systémech, které se používají v teorii jazyků. Teoretický výzkum těchto modelů bude diskutovat užitečné transformace těchto systémů, jako např. eliminace vymazávajících pravidel či redukce velikosti jejich komponent. Výzkum aplikací takto transformovaných systémů se bude soustředit na oblasti informatiky související s překladači, matematickou lingvistikou a molekulární biologií.
Rozpoznávání podle obličeje v posledních letech zažilo výrazný posun, přičemž oblastí, kde lze stále zlepšovat, je rekonstrukce snímků obličeje pomocí umělé inteligence. V rámci tohoto výzkumu očekáváme návrh nových metod, které by měly zlepšit možnosti rozpoznávání s nekvalitními snímky obličeje (například nízké rozlišení, překryvy, rozmazání). Cílem je vytvořit forenzní knihovnu s inovativními algoritmy, jejímž využitím by se zvýšila pravděpodobnost rozpoznání osoby podle obličeje.
Cílem disertační práce je výzkum modelů vestavěné inteligence, která explicitně pracuje s energetickou náročností konkrétních operací a optimalizuje svoji činnost na základě konkrétních omezení na straně jednotlivých zařízení, případně celého systému. Součástí bude i realizace vybraných modelů na vhodném typu hardware, který bude možné využít v mezinárodních projektech, na jejichž řešení se vedoucí podílí.
Projekt se zabývá geo-lokalizací v neznámém prostředí pomocí metod počítačového vidění a počítačové grafiky. Hlavním cílem je výzkum a návrh nových metod registrace obrazu s geo-lokalizovanou obrazovou databází nebo s 3D modelem terénu. Cílem je též implementace navržených metod na mobilních zařízeních a hledání jejich dalších aplikací např. v oblastech zpracování obrazu, výpočetní fotografie a rozšířené reality.
Téma se zabývá metrikami pro odhad vizuální kvality obrazu a videa. Cílem práce je výzkum nových metod, které by odstranily některé nedostatky existujících metrik zejména s ohledem na vlastnosti vizuálního vnímání člověka. V úvahu přicházejí např. problémy z oblasti vjemu HDR obrazu a využití přídavných informací (metadata, 3D, atd.) o testovaných scénách pomocí metod strojového učení (např. neuronových sítí).
Použití některých metod strojového učení, například v poslední době populárních hlubokých neuronových sítí, přináší problémy architektury tzv. černé skříňky, která sice může v některých případech správně rozhodovat, ale není možné snadno interpretovat způsob rozhodování, ověřovat, v jakém kontextu jsou závěry ještě věrohodné a nakolik mohou vést drobné změny vstupu ke zcela jiným závěrům.Cílem disertační práce je rozvinout existující přístupy k měření "dokazatelně správných" modelů umělých neuronových sítí a propojit je s technikami generování konfliktních (adversarial) příkladů, aby bylo možné kontrolovat a revidovat existující řešení, využívaná v praxi. Součástí práce bude i aplikace zkoumaných metod v rámci evropských projektů, na jejichž řešení se školitel podílí.
Výzkumný problém: Závislost na alkoholu je chronická a komplexní mozková porucha způsobující zničující individuální i sociální problémy. Kromě toho alkohol způsobuje 3,3 milionu úmrtí ročně na celém světě, což je téměř 6 % všech úmrtí. Mnoho z těchto úmrtí je spojeno se závislostí na alkoholu. Proto je důležité prozkoumat metody pro diagnostiku a léčbu závislosti na alkoholu.
Problémy se současnými řešeními: Obvykle se screening a hodnocení problémů souvisejících s alkoholem zakládá hlavně na zprávách z autotestů. Přesnost zpráv o autotestech však byla zpochybněna, zejména u silných pijáků, protože zprávy z autotestů mohou zkreslovat diagnózu kvůli ztrátě paměti pacienta (pacienti nemohou měřit spotřebu alkoholu) a/nebo nečestnému chování. Proto tento výzkum navrhuje vyvinout objektivní a kvantitativní metodu pro detekci závislosti na alkoholu.
Výzvy: Vzhledem k tomu, že závislost na alkoholu vede ke změnám v dynamice mozku, je životně důležité prozkoumat a vyvinout metodu založenou na mozkové aktivitě. Hlavní výzva při vývoji takové objektivní a kvantitativní metody však spočívá v její implementaci pro screening v menších klinických zařízeních. To omezuje vyšetřování na elektroencefalogram (EEG), který je levný, vysoce mobilní a má dobré časové rozlišení. Jiné modality, jako je MRI, PET atd., není možné použít v menších klinických zařízeních.
Téma práce: Se současnými inovacemi v mozkových EEG signálech lze zkoumat mozkové dráhy zapojené do závislosti. V posledních několika desetiletích byl výzkum EEG používán k pochopení komplexních základních procesů spojených s patofyziologií závislosti. Interpretace takových procesů pomocí mozkových sítí pomocí EEG může pomoci nejen při diagnostice závislosti, ale také pomoci při léčbě závislosti. Tento výzkum si klade za cíl vyvinout neuromarkery založené na interpretaci mozkové sítě pomocí EEG. Neuromarker bude zahrnovat extrakci funkcí a odpovídající vývoj modelu strojového učení.
Pár slov o školiteli: Dr. Malik nedávno nastoupil na FIT VUT v Brně. Má desetiletou zkušenost s prací v oblasti zpracování neuro-signálů a neuro-obrazu. V současné době je v procesu zakládání výzkumné skupiny v této oblasti na FIT. Jedná se o multidisciplinární projekt, který bude zahrnovat spolupráci s klinickými lékaři. Jádro projektu však souvisí s IT. Jedná se o vývoj nové metody. Neváhejte mě kontaktovat na malik@fit.vutbr.cz
Rozvoj veľkých jazykových modelov (large language models, LLM) v posledných mesiacoch ukazuje potenciál hlbokého učenia a umelých neurónových sietí pre mnoho úloh spracovania prirodzeného jazyka (natural language processing, NLP). Pokroky v ich automatizácii majú významný dopad na množstvo inovatívnych aplikácií ovplyvňujúcich každodenný život.
Aj keď sú veľké jazykové modely úspešne využívané pri riešení veľkého množstva úloh, stále zostávajú viaceré výskumné výzvy týkajúce sa jednotlivých úloh spracovania prirodzeného jazyka, aplikačných domén a samotných jazykov. K nim pribúdajú ďalšie výzvy vychádzajúce z podstaty veľkých jazykových modelov a netransparentnej povahy modelov založených na neurónových sieťach (tzv. black-box modely).
Je potrebný ďalší výskum a prieskum súvisiacich javov, špeciálnu pozornosť v poslednej dobe púta problém dôveryhodnosti modelov pre NLP (tzv. trustworthy NLP) alebo nové paradigmy učenia adresujúce problém nízkej dostupnosti zdrojov potrebných pre učenie (tzv. low-resource NLP).
Zaujímavé výskumné výzvy, na ktoré sa možno v rámci témy zamerať (príkady):
Výskum bude doktorand(ka) vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.
Školitel: Šimko Marián, doc. Ing., Ph.D.
Veľké jazykové modely sa čoraz častejšie používajú pre široké spektrum úloh, pri ktorých vykazujú dobrú výkonnosť pri použití v podmienkach bez priameho príkladu (zero-shot) alebo s niekoľkými príkladmi (few-shot), a to aj v porovnaní so špecializovanými dotrénovanými modelmi. Platí to predovšetkým pre úlohy, pri ktorých môžu veľké jazykové modely využiť znalosti, ktoré získali počas ich predtrénovania. Avšak pri úlohách, ktoré vyžadujú špecifickejšie doménové znalosti či adaptáciu, veľké jazykové modely aktuálne zaostávajú. Okrem toho trpia rôznymi problémami, ako sú napr. halucinácie (generovanie koherentného výstupu, ktorý je však fakticky nesprávny alebo nezmyselný) alebo generovanie textu obsahujúceho predsudky naučené z dát použitých počas predtrénovania. Boli navrhnuté rôzne prístupy na riešenie týchto problémov, napr. lepšie stratégie tvorby dopytov (vrátane kontextuálneho učenia), generovanie obohatené o vyhľadávanie alebo adaptácia veľkých jazykových modelov pomocou efektívneho dotrénovania.
Každý z týchto prístupov (alebo ich kombinácia) predstavuje príležitosť pre nové objavy. Ortogonálne k týmto prístupom stoja vlastnosti modelov ako miera ich zhody s ľudskými hodnotami, robustnosť, vysvetliteľnosť alebo interpretovateľnosť, ktoré sú dôležitým faktorom a prínos v tomto smere je vítaný (v rámci uvádzaných techník aj všeobecne v umelej inteligencii).
Existuje veľa úloh, kde sa metódy adaptácie veľkých jazykových modelov dajú uplatniť. Nachádzajú sa medzi nimi aj veľmi aktuálne oblasti detekcie nepravdivých informácií (dezinformácií), detekcie signálov kredibility obsahu, auditovanie algoritmov sociálnych médií a ich tendencií šíriť dezinformácie, či podpora overovania informácií (fact-checking).
Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave v spolupráci s priemyselnými partnermi alebo výskumníkmi zo svetovo uznávaných výskumných skupín v rámci medzinárodných výskumných grantov. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.