Nový předmět PA212: Advanced Search Techniques for Large Scale Data Analytics
Předmět se zaměřuje na problematiku škálovatelných vyhledávacích technik pro
aplikace řešící především dolování a analýzu informací v rozsáhlých kolekcích
nestrukturovaných dat (např. textové dokumenty nebo multimediální data). Po
absolvování předmětu studenti porozumí základním distribuovaným algoritmům pro
práci s velkými daty, jakou jsou například Locality-sensitive hashing, MapReduce
nebo PageRank. Důraz bude rovněž kladen na techniky zpracování proudových
(streamových) dat. Základní principy budou doplněny četnými praktickými
příklady.
Předmět čerpá poznatky a zkušenosti s podobnými předměty předních světových
univerzit a bude vyučován v angličtině. Přesto, že je předmět určen především
magisterským a postgraduálním studentům, snaží se být soběstačný bez
specifických znalostních předpokladů.