IB047: Úvod do korpusové lingvistiky a počítačové lexikografie
Anotace
Předmět poskytne základní znalosti v oblasti korusové lingvistiky a
počítačové lexikografie. Seznámí studenty s typy korpusů, jejich
budováním a používáním. Naučí studenty pracovat s korpusy a jinými
zdroji pro potřeby tvorby elektronických slovníků.
Výuka
- Zápočet: vyřešení praktického úkolu, jedno z nasledujicich:
- semanticke znackovani
- vycisteni treebanku -- lehke programovani -- zadani ustne po dohode na jak@fi.muni.cz
- Zkouška: písemná
Slidy z přednášek
- úvod pdf
- p1 pdf
ukázky formátů korpusů a slovníků
- p2 pdf
coreutils,
příklady pro korpusy
příklady použití
- p3 pdf
- ajka pdf-1 pdf-2
- p5 pdf
Bonito -- Dotazovací jazyk
- p6 pdf
- p7 pdf
- p9 pdf
Literatura
- L216 Sampson, Geoffrey. Empirical linguistics. London : Continuum, 2001. viii, 226. Open linguistics series. ISBN 0-8264-4883-6.
- Computational lexicography for natural language processing. Edited by Ted Briscoe - Bran Boguraev. London : Longman, 1989. xiv, 310 p. Bibliography. ISBN 0-470-21187-3.
- L96 Corpus processing for lexical acquisition. Edited by Bran Boguraev - J. (James) Pustejovsky. Cambridge : Bradford Book, 1996. xi, 245 s. Language, speech, and communication. ISBN 0-262-02392-.
- L269 Sampson, Geoffrey. English for the computer : the SUSANNE corpus and analytic scheme. Oxford : Clarendon Press, c1995
- Rychlý, Pavel. Korpusové manažery a jejich efektivní
implementace. Brno, 2000. xiv, 128 s. Dizertační
práce--Masarykova univerzita, Fakulta informatiky, 2000.
[Postscript,
PDF]
Pavel Rychly