Text mining, dolování znalostí z textu
Dolování znalostí z textu je oblastí na rozhraní počítačové lingvistiky, strojového učení a statistiky. Objevování zákonitostí v textu se využívá např. pro automatickou morfologickou analýzu, ale také pro filtrování spamů, rozpoznávání autorství, žánru a obsahu textu, hledání klíčových slov nebo extrakci informace z textu.
Hlavní výzkumné směry
- Kategorizace dokumentů
- Extrakce informace z textu
- Linked data mining
- Klíčová slova a klíčové vzory
- Předzpracování dat pro dolování z textu
- Web mining a dolování z hypertextu
Výzkumný tým
Vedoucí skupiny:
Luboš Popelínský
Staff:
Eva Mráková
PhD studenti:
Petr Glos (spatio-temporal data mining), Petr Kosina (stream mining, nyní v Portu),
Jaroslav Bayer, Jan Géryk (mining z dat v IS MU), Šimon Suchomel (text mining)
Studenti:
Juraj Hreško (klasifikace webových stránek),
Juraj Jurčo (extrakce informace z webu, nyní v Portu),
Jan Knotek (extrakce informace z webu),
Jindřich Tandler (dolováni v sociálních sítích)
Laboratoř dobývání znalostí FI MU
Laboratoř - KD Lab - se zabývá teorií induktivní inference a strojového učení, návrhem a implementací algoritmů a aplikacemi strojového učení a dobývání znalostí z dat.
KD Lab těsně spolupracuje kromě českých a slovenských universit také s výzkumnými skupinami LIAAD Universidade do Porto a I&A TaoLRI Université Paris-Sud.
Bližší informace můžete získat na stránkách laboratoře, na seminářích konaných každé úterý od 17,00 nebo od současných i bývalých členů labu.
Kontakt
Luboš Popelínský
popely=BJR3ryH@fiFrX5NOKhS.muniPaRSqTiiP.cz
www.fi.muni.cz/~popel/
B418 FI MU