Korpusové manažery a jejich efektivní implementace

Pavel Rychlý

Abstrakt:

Předkládaná práce se zabývá korpusovými manažery, tedy programovými nástroji pro zpracování korpusů. Korpusem zde rozumíme rozsáhlý soubor textů v elektronické podobě. Většinou slouží jako zásoba příkladů užití jazyka pro studium slov, jejich významů a nejčastějších kontextů. Korpusy se používají v celé řadě oblastí lingvistiky (od morfologie, přes syntaxi, sémantiku, stylistiku až po sociolingvistiku) a právě korpusové manažery jsou primárními nástroji sloužící k jejich studiu.

Práce se snaží především popsat a zdůvodnit, jaké služby by měl všeobecně použitelný korpusový manažer poskytovat. Jednotlivé vlastnosti manažeru jsou rozebrány jak z pohledu uživatele, tak z hlediska implementace. Pro klíčové operace jsou navrženy algoritmy a datové struktury, které zajišťují rychlé provádění všech funkcí při minimálních nárocích na operační i diskovou paměť počítače.

Výsledky práce již jsou využívány při tvorbě nového rychlejšího a efektivního korpusového manažeru.