Text mining

Text mining, dolování znalostí z textu

Dolování znalostí z textu je oblastí na rozhraní počítačové lingvistiky, strojového učení a statistiky. Objevování zákonitostí v textu se využívá např. pro automatickou morfologickou analýzu, ale také pro filtrování spamů, rozpoznávání autorství, žánru a obsahu textu, hledání klíčových slov nebo extrakci informace z textu.

Hlavní výzkumné směry

Kategorizace dokumentů
Extrakce informace z textu
Linked data mining
Klíčová slova a klíčové vzory
Předzpracování dat pro dolování z textu
Web mining a dolování z hypertextu

Výzkumný tým

Vedoucí skupiny:
Luboš Popelínský

Staff:
Eva Mráková

PhD studenti:
Petr Glos (spatio-temporal data mining), Petr Kosina (stream mining, nyní v Portu), Jaroslav Bayer, Jan Géryk (mining z dat v IS MU), Šimon Suchomel (text mining)

Studenti:
Juraj Hreško (klasifikace webových stránek), Juraj Jurčo (extrakce informace z webu, nyní v Portu), Jan Knotek (extrakce informace z webu), Jindřich Tandler (dolováni v sociálních sítích)

Laboratoř dobývání znalostí FI MU

Laboratoř - KD Lab - se zabývá teorií induktivní inference a strojového učení, návrhem a implementací algoritmů a aplikacemi strojového učení a dobývání znalostí z dat.

KD Lab těsně spolupracuje kromě českých a slovenských universit také s výzkumnými skupinami LIAAD Universidade do Porto a I&A TaoLRI Université Paris-Sud.

Bližší informace můžete získat na stránkách laboratoře, na seminářích konaných každé úterý od 17,00 nebo od současných i bývalých členů labu.

Kontakt

Luboš Popelínský
popely=BJR3ryH@fiFrX5NOKhS.muniPaRSqTiiP.cz
www.fi.muni.cz/~popel/
B418 FI MU