Okruh Počítačové zpracování přirozeného jazyka

Podokruhy:

Formální struktura přirozeného jazyka

Anotace:
Formální popis přirozeného jazyka vychází z členění na jazykové roviny (morfologickou, syntaktickou a sémantickou). Uchazeč se seznámí se základními teoretickými přístupy a pojmy ve vztahu k jednotlivým rovinám jazyka (konečné automaty, formální gramatiky, logické formalismy aj.) a také s konstrukcí standardně užívaných nástrojů (morfologické, syntaktické analyzátory).

Osnova:
Základní jednotky morfologické roviny, algoritmický popis (české) morfologie, nástroje pro morfologii (analyzátory, lemmatizátory, značkovače), formální gramatiky pro přirozený jazyk slova, pravidla a struktury, typy gramatik (CFG, CCG, HPSG, LTAG, LFG), valenční (slovesné) rámce povrchové a hloubkové, syntaktická analýza a analyzátory (statistické, pravidlové, chart parsing, chunking).

Základní studijní materiál:
J. Allen, Natural language understanding, kapitoly 1-7.
R. Mitkov, The Oxford Handbook of Computational Linguistics, Oxford University Press, 2009, kap. 1-5, 8, 10-12, 19, 24, 26

Zkoušející: doc. Aleš Horák, prof. Karel Pala, doc. Pavel Rychlý, dr. Pavel Šmerk

Další doporučená literatura:
C. Manning and H. Schütze, Foundations of Statistical Natural Language Processing, MIT Press, 1999.

Reprezentace významu a vyvozování znalostí

Anotace:
Reprezentace významu je v oblasti počítačového zpracování jazyka klíčová uchazeč se seznámí s lexikální a logickou sémantikou a s technikami a nástroji používanými pro uchopení významu slov a slovních spojení (definice významu, elektronické slovníkové systémy, sémantické sítě). Logická analýza vět přirozeného jazyka zahrnuje zvládnutí logických formalismů a nástrojů, jež jich využívají (normální translační algoritmus).

Osnova:
Lexikální význam slova a slovní spojení (kolokace), sémantické sítě, rámce, ontologie, rozpoznávání významů slov WSD, sémantická klasifikace sloves, kompozicionalita, význam a reference, pojem definice a analýza, sémantické reprezentace vět založené na predikátové logice a intenzionální logice, algoritmus sémantické analýzy - normální translační algoritmus, inference logická a typu "common sense".

Základní studijní materiál:
J. Allen, Natural language understanding, 1995, kapitoly 8-12
R. Mitkov, The Oxford Handbook of Computational Linguistics, Oxford University Press, 2009, kap. 5, 8, 9, 13, 14, 21, 25, 31

Zkoušející: doc. Aleš Horák, prof. Karel Pala, doc. Pavel Rychlý

Další doporučená literatura:
P. Materna, Conceptual Systems, LOGOS Verlag Berlin, 2004.

Pragmatické aspekty komunikace

Anotace:
Pragmatické aspekty komunikace zahrnují teoretickou analýzu komunikační situace. Uchazeč se seznámí s externí a interní pragmatikou, analýzou promluvy a s technikami a nástroji používanými pro analýzu textových vztahů (algoritmy pro rozpoznávání anafor, segmentace promluvy). Vedle toho sem patří dialogové vztahy a analýza emocionálních postojů uživatele jazyka.

Osnova:
Interní pragmatika, externí pragmatika, komunikační situace, analýza promluvy, anafora, anaforické vztahy a jejich rozpoznávání v textu, segmenty v promluvě a jejich rozpoznávání, dialogové systémy, analýza sentimentu.

Základní studijní materiál:
J. Allen, Natural language understanding, 1995, kapitoly 13-17
R. Mitkov, The Oxford Handbook of Computational Linguistics, Oxford University Press, 2009, kap. 6-7, 15-17, 20-25, 31, 35-38

Zkoušející: doc. Aleš Horák, prof. Karel Pala, doc. Pavel Rychlý

Další doporučená literatura:
Grice, H. Paul. Studies in the Way of Words. Harvard University Press, 1989.
Mira Ariel. Defining Pragmatics. Cambridge University Press, 2010.

Pragmatické aspekty komunikace

Anotace:
Pragmatické aspekty komunikace zahrnují teoretickou analýzu komunikační situace. Uchazeč se seznámí s externí a interní pragmatikou, analýzou promluvy a s technikami a nástroji používanými pro analýzu textových vztahů (algoritmy pro rozpoznávání anafor, segmentace promluvy). Vedle toho sem patří dialogové vztahy a analýza emocionálních postojů uživatele jazyka.

Osnova:
Interní pragmatika, externí pragmatika, komunikační situace, analýza promluvy, anafora, anaforické vztahy a jejich rozpoznávání v textu, segmenty v promluvě a jejich rozpoznávání, dialogové systémy, analýza sentimentu.

Základní studijní materiál:
J. Allen, Natural language understanding, 1995, kapitoly 13-17
R. Mitkov, The Oxford Handbook of Computational Linguistics, Oxford University Press, 2009, kap. 6-7, 15-17, 20-25, 31, 35-38

Zkoušející: doc. Ivan Kopeček, doc. Aleš Horák, prof. Karel Pala

Další doporučená literatura:
Grice, H. Paul. Studies in the Way of Words. Harvard University Press, 1989.
Mira Ariel. Defining Pragmatics. Cambridge University Press, 2010.

Strojový překlad a jeho vztahy k umělé inteligenci

Anotace:
Oblast strojového překladu představuje aplikační oblast, v níž se ověřují a testují teoretické poznatky a nástroje získané a vyvinuté v počítačovém zpracování jazyka jako celku. Uchazeč zde má možnost pokusit se o zvládnutí úloh, které patří ve vztahu k umělé inteligenci k nejobtížnějším.

Osnova:
Přístupy ke strojovému překladu - pravidlový, statistický, hybridní; pravidlový strojový překlad - analýza, transfer a syntéza; statistický strojový překlad - role paralelních korpusů, jazykové modely; překlad na základě frází a příkladů; evaluace výsledků strojového překladu - metriky.

Základní studijní materiál:
C.Goutte et al., Learning machine translation, MIT Press, 2009, kapitoly 1-6
W.J. Hutchins \& H.L. Somers, An introduction to machine translation, Academic Press, 1992, kapitoly 3-5.

Zkoušející: doc. Aleš Horák, prof. Karel Pala, doc. Pavel Rychlý

Další doporučená literatura:
P. Koehn, Statistical machine translation, CUP, 2010.