Text mining, dolování znalostí z textu

Dolování znalostí z textu je oblastí na rozhraní počítačové lingvistiky, strojového učení a statistiky. Objevování zákonitostí v textu se využívá např. pro automatickou morfologickou analýzu, ale také pro filtrování spamů, rozpoznávání autorství, žánru a obsahu textu, hledání klíčových slov nebo extrakci informace z textu.


Hlavní výzkumné směry

  • Kategorizace dokumentů
  • Extrakce informace z textu
  • Linked data mining
  • Klíčová slova a klíčové vzory
  • Předzpracování dat pro dolování z textu
  • Web mining a dolování z hypertextu

Výzkumný tým

Vedoucí skupiny:
Luboš Popelínský

Staff:
Eva Mráková

PhD studenti:
Petr Glos (spatio-temporal data mining), Petr Kosina (stream mining, nyní v Portu), Jaroslav Bayer, Jan Géryk (mining z dat v IS MU), Šimon Suchomel (text mining)

Studenti:
Juraj Hreško (klasifikace webových stránek), Juraj Jurčo (extrakce informace z webu, nyní v Portu), Jan Knotek (extrakce informace z webu), Jind≈ôich Tandler (dolováni v sociálních sítích)


Laboratoř dobývání znalostí FI MU

Laboratoř - KD Lab - se zabývá teorií induktivní inference a strojového učení, návrhem a implementací algoritmů a aplikacemi strojového učení a dobývání znalostí z dat.

KD Lab těsně spolupracuje kromě českých a slovenských universit také s výzkumnými skupinami LIAAD Universidade do Porto a I&A TaoLRI Université Paris-Sud.

Bližší informace můžete získat na stránkách laboratoře, na seminářích konaných každé úterý od 17,00 nebo od současných i bývalých členů labu.


Kontakt

Luboš Popelínský
popel OD fi.muni.cz
www.fi.muni.cz/~popel/
B418 FI MU