Doktorandské pozice na katedře strojového učení a zpracování dat

Přeloženo pomocí

Stránka přeložená strojově pro lepší dosažitelnost obsahu tazateli užívajícími češtinu.

Doktorandské pozice na katedře strojového učení a zpracování dat

Katedra strojového učení a zpracování dat Fakulty informatiky Masarykovy univerzity vypisuje výběrové řízení na jedno doktorandské místo s nástupem od podzimního semestru 2024, a to v následujících oblastech:

Téma - Inteligentní vícejazyčná komunikace člověka se strojem
Školitel: doc. Aleš Horák
Téma - Syntéza a verifikace stochastických systémů pomocí učících se metod
Školitel doc. Tomáš Brázdil
Téma - Detekce a popis anomálií
Vedoucí práce doc. Lubomír Popelínský
Téma - Systém pro podporu klinického rozhodování nové generace
Supervizor doc. Vít Nováček
Téma - Nástroje a algoritmy pro lepší pochopení eukaryotického repetitivního kódu .
Vedoucí práce doc. Matěj Lexa
Téma - Efektivní cross-modální vyhledávání v datech o lidském pohybu
Vedoucí práce doc. Jan Sedmidubský
Téma - Personalizované a vysvětlitelné vyhledávání podobností
Supervizor Prof. Pavel Zezula

Uzávěrka přihlášek je 12. května 2024.

Obecné informace

Od perspektivních doktorandů se očekává, že prokáží své výzkumné zázemí a dovednosti v oblasti zvoleného tématu doktorského studia. Měli by také ovládat angličtinu; předchozí znalost češtiny není nutná.

Stipendium

Přihlášky bude hodnotit komise katedry, jejíž členové vyberou nejlepšího uchazeče. Vyhlášené doktorandské místo je financováno mimořádným katederním stipendiem ve výši 10 000 Kč měsíčně (v součtu se standardním fakultním stipendiem v českém studijním programu při splnění předložených podmínek až 45 000 Kč). Stipendium je úspěšnému uchazeči přiznáno na první 2 roky, s předpokládaným prodloužením (po vyhodnocení) na další 2 roky. Celková délka studia je 4 roky.

Postup podávání žádostí

Uchazečům se doporučuje, aby se v dostatečném předstihu před uzávěrkou přihlášek obrátili přímo na svého perspektivního školitele (uvedeného níže), který jim poskytne bližší informace. Konečné přihlášky sestávající z životopisu, motivačního dopisu, popisu časového plánu studia a očekávaných výstupů a případně dalších relevantních dokumentů dokládajících excelenci uchazeče se zasílají vedoucímu katedry.

doc. Aleši Horákovi, a to do příslušného termínu pro podání přihlášek (viz výše).

Uchazeči jsou ještě povinni absolvovat standardní přijímací řízení do doktorského studia. Stipendium může být přiznáno až po úspěšném absolvování standardního přijímacího řízení.

Téma - Inteligentní vícejazyčná komunikace člověk-stroj

Školitel doc. RNDr. Aleš Horák, Ph.D.
Oblast - Zpracování přirozeného jazyka, reprezentace znalostí, řízení dialogu

Komunikace mezi člověkem a počítačovým programem je jedním z dlouhodobých cílů oboru NLP. Současné systémy spojené s komunikací ve stylu chatbotů jsou schopny uspokojivě odpovídat na širokou škálu dotazů, pozadí takové komunikace se však drží převážně na lexikální úrovni. Nedávné výsledky v úloze odpovídání na otázky v otevřené doméně slibují přinést adekvátní zázemí pro takové dialogy.

Cílem práce je spojit oba přístupy (obecné diskusní roboty a systémy pro zodpovídání otázek) v novém přístupu se zaměřením na vícejazyčné prostředí. V hodnotící části musí práce nabídnout nové výsledky (také) pro jiné než běžné jazyky, aby se prokázala její použitelnost pro široké spektrum jazyků.

Publikace vztahující se k danému tématu lze nalézt na stránkách Centra NLP FI MU

Téma - Syntéza a verifikace stochastických systémů pomocí učících se metod

Vedoucí práce doc. RNDr. Tomáš Brázdil, Ph.D.
Oblast - Teoretická informatika, Formální metody

Zaměřujeme se na analýzu systémů, které vykazují náhodnost a nedeterminismus. Náhodnost často pramení z poruch fyzických komponent, nespolehlivé komunikace, randomizace apod. Nedeterminismus přirozeně vzniká z nedostatečné specifikace, souběžnosti atd. Takové systémy se obvykle modelují pomocí Markovových rozhodovacích procesů (MDP) nebo stochastických her. Tyto modely jsou již desítky let široce studovány v různých kontextech, jako je inženýrství, umělá inteligence a strojové učení (AI-ML) a v poslední době také formální verifikace. Nedávné výsledky naznačují, že oblast formální verifikace může mít obrovský prospěch z výsledků a metod vyvinutých v rámci AI-ML. Cílem tohoto doktorského projektu je dále zkoumat vzájemné působení metod syntézy z AI-ML a formální verifikace MDP a stochastických her.

Téma - Detekce a popis anomálií

Školitel doc. RNDr. Lubomír Popelínský, Ph.D.
Oblast - Detekce anomálií

Analýza anomálií (odlehlých hodnot, vzácných událostí) je zaměřena na vyhledávání anomálních případů v datech. Anomální znamená potenciálně vzniklý jiným mechanismem než většina dat. Detekce je však pouze prvním krokem analýzy. Druhý hledá popis a vysvětlení nalezené anomálie a může být úzce spojen s výběrem příznaků pro detekci anomálií.

Cílem tohoto doktorského výzkumu je vypracovat nové metody detekce a popisu anomálií. Výzkum může být zaměřen na konkrétní doménu, např. text, strukturovaná data, jako jsou grafy nebo věty, a/nebo na konkrétní druh anomálií, např. anomálie založené na třídách nebo anomálie v logice.

Téma - Systém podpory klinického rozhodování nové generace

Vedoucí práce: Doc. Mgr. bc. Vít Nováček, PhD.
Obor - Lékařská informatika, podpora klinického rozhodování

V posledních letech se pokročilé techniky strojového učení (ML), jako je hluboké, reprezentační a relační učení, podílely na řadě průlomových objevů v lékařské informatice (např. stanfordský model pro predikci melanomu na úrovni dermatologa v roce 2017). Tyto pokroky byly umožněny rostoucí vyspělostí různých metod strojového učení použitelných pro takové případy použití a obrovskými objemy a počty souborů dat z oblasti přírodních věd, které se staly dostupnými pro strojové zpracování. V oblasti strojového učení a aplikací umělé inteligence v medicíně však stále zůstává mnoho zásadních problémů nevyřešených. Jednou z nejdůležitějších nedostatečně prozkoumaných oblastí je například vysvětlitelnost prediktivních modelů na bázi umělé inteligence pro podporu klinického rozhodování. Strojově podporované techniky pro navrhování možných diagnóz nebo personalizovaných terapií dnes sice existují, ale jejich důvěryhodnost a použitelnost je často kriticky omezena neschopností modelů vysvětlit svá doporučení. Pokrok v této oblasti by proto znamenal nejen možný akademický průlom, ale také výsledek s potenciálně obrovským společenským a ekonomickým dopadem.

Cíle této práce jsou následující:

Vybrat případ použití motivovaný skutečnou, dosud neřešenou klinickou výzvou (např. předpovídání cílené léčby na základě molekulárního profilování vzácných dětských nádorů),
provést průzkum použitelných přístupů strojového učení a/nebo umělé inteligence a identifikovat jejich nedostatky,
řešit tyto nedostatky novým, ze své podstaty vysvětlitelným přístupem,
ověřit tento přístup v rámci vybrané výzvy.

Téma - Nástroje a algoritmy pro lepší pochopení eukaryotického repeticomu

Vedoucí práce doc. Ing. Matej Lexa, Ph.D.
Oblast - Bioinformatika, výpočetní analýza sekvence DNA a genomu, sekvence repetic.

Opakující se DNA v sekvenovaných genomech eukaryot často způsobuje problémy při analýzách těchto genomů, je však také bohatým zdrojem málo známých evolučních a funkčních informací.

Cílem perspektivní práce by bylo identifikovat slepá místa v naší schopnosti nalézt a interpretovat tento druh informací a navrhnout algoritmy a výpočetní nástroje, které by nám poskytly nové informace o evoluční historii a funkci repetic v genomech.

Příklady možných směrů jsou:

detekce a kvantifikace rekombinačních událostí v genomu i mimo něj;
simulační model dynamiky opakování v eukaryotických genomech;
nástroje a algoritmy pro práci s pan-repeatomem nebo
opakování v kontextu 3D organizace chromatinu v jádře.

Lze diskutovat i o dalších souvisejících směrech.

Téma - Efektivní cross-modální vyhledávání v datech o lidském pohybu

Vedoucí práce doc. RNDr. Jan Sedmidubský, Ph.D.
Oblast - Vyhledávání informací, počítačové vidění

Díky nedávným pokrokům v metodách odhadování polohy lze z běžného videa extrahovat lidský pohyb v podobě 3D sekvencí kostry. Efektivní a účinný přístup k velkým objemům extrahovaných skeletových dat založený na obsahu však stále zůstává náročným problémem. Cílem tohoto doktorského tématu, inspirovaného nedávným úspěchem cross-modálních vizionářsko-jazykových modelů pro domény obrazu a videa, je navrhnout nové techniky pro vyhledávání pohybu z textu, které jsou schopny efektivně vyhledávat relevantní pohyby na základě popisu v přirozeném jazyce. Toto téma zahrnuje několik výzkumných problémů, které je třeba vyřešit: přijetí/vytvoření rozsáhlého souboru dat o pohybu, který poskytuje sekvence skeletů spolu s textovými popisy, návrh hlubokých kódovačů pohybu pro reprezentaci komplexních dat skeletů pomocí sémantických rysů, indexování sémantických rysů a učení společného prostoru pro vkládání pohybu a textových modalit. Vyvinuté techniky vyhledávání textu v pohybu by mohly najít uplatnění v mnoha oblastech, jako je počítačová animace, bezpečnost nebo sport.

Téma - Personalizované a vysvětlitelné vyhledávání podobnosti

Vedoucí práce: prof. ing. Pavel Zezula, CSc.
Oblast - Správa dat, Vyhledávání informací, Vyhledávání podle podobnosti

Vyhledávání podobností je základní operací mnoha úloh zpracování dat, jako je čištění a integrace dat, detekce odlehlých hodnot, dolování častých vzorů, shlukování, klasifikace a mnoho dalších. Vyhledávání podobnosti vyhledává objekty v různých kolekcích dat - jako jsou text, obrázky, zvuk, video, grafy nebo hluboké síťové vložky - podle určité definice stejnosti. Ačkoli současné systémy mohou nepochybně reflektovat různorodost dat a měr podobnosti, po rozhodnutí konkrétní systémy vyhledávání podobnosti používají stejnou vizi podobnosti pro všechny své uživatele a cíle vyhledávání. To je v rozporu s přirozeným chápáním podobnosti, které je subjektivní a závislé na kontextu.

Cílem navrhované práce je rozšířit funkčnost stávajících systémů o dvě důležité vlastnosti: vysvětlitelnost a personalizaci. Vysvětlitelnost řeší případné otázky uživatelů, proč vyhledávací systém považuje konkrétní vyhledané objekty za podobné, čímž podporuje důvěru uživatelů a usnadňuje zdokonalování systému. Personalizace umožňuje uživatelům používat jejich pohled na podobnost při využití stejné globální indexové struktury. Tento přístup minimalizuje nerelevantní výsledky a lépe odpovídá individuálním preferencím uživatelů. Tato práce se v podstatě pokouší překlenout propast mezi statickými, univerzálními systémy vyhledávání podobností a dynamickou, subjektivní povahou lidského chápání tím, že do stávajících systémů začlení vysvětlitelnost a personalizaci.

Publikace vztahující se k tématu lze nalézt na adrese https://scholar.google.com/citations?user=EHIdRAYAAAAJ, nebo https://dblp.org/pid/z/PZezula.html.