Zpracování přirozeného jazyka
Zpracování přirozeného jazyka neboli NLP pokrývá podstatnou část celého oboru umělé inteligence - interakci člověka s počítačem, pokročilé zpracování informací, automatizované uvažování nebo strojový překlad mezi lidskými jazyky i logickými formalismy jako "počítačovými" jazyky.
- Formální struktura přirozeného jazyka
- Reprezentace znalostí a uvažování
- Pragmatické aspekty komunikace
- Strojový překlad
Formální struktura přirozeného jazyka
- Anotace
- Formální popis přirozeného jazyka je často založen na úrovních lingvistické analýzy (morfologické, syntaktické a sémantické). Uchazeč se seznámí se základními teoretickými přístupy a koncepty ve vztahu k jednotlivým úrovním analýzy (konečné automaty, formální gramatiky, logické formalismy atd.) a také s konstrukcí standardních nástrojů (morfologické analyzátory, parsery).
- Klíčová slova
- Základní jednotky morfologické úrovně, algoritmický popis (české) morfologie, nástroje morfologické analýzy (tagger, lemmatizátor, guesser), formální gramatiky přirozeného jazyka, pravidla a struktury, typy gramatik (CFG, CCG, HPSG, LTAG, LFG), (slovní) valenční rámce (povrchové a hloubkové), parsery a syntaktické analyzátory (statistické, pravidlové, parsování grafů, částečné parsování/chunking).
- Základní studijní materiál
-
- J. Eisenstein, Introduction to Natural Language Processing (2019), MIT Press, kap. 8-11
-
R. Mitkov,
The Oxford Handbook of Computational Linguistics 2nd edition (
MU proxy), Oxford University Press
2. vydání 2014-2021: kap. 1-5, 9, 19-21, 23-26
1. vydání 2005: kap. 1-5, 8, 10-12, 19, 24, 26
- Zkoušející
- doc. RNDr. Aleš Horák, Ph.D., doc. Mgr. Pavel Rychlý, Ph.D.
- Další doporučená literatura
-
- Jurafsky and Martin, Speech and Language Processing (2023, 3rd ed. draft)
Reprezentace znalostí a uvažování
- Anotace
- Reprezentace významu a odvozování nových znalostí jsou základními oblastmi v oblasti počítačového zpracování jazyka. Uchazeč se seznámí s lexikální a logickou sémantikou a s technikami a nástroji používanými k zachycení významu slov a slovních spojení (definice významu, systémy elektronických slovníků, sémantické sítě, ontologie). Logická analýza vět přirozeného jazyka zahrnuje zvládnutí logických formalismů a nástrojů, které je používají (normální překladový algoritmus).
- Klíčová slova
- Lexikální význam slov a frází (kolokace), sémantické sítě, rámce, ontologie, disambiguace slovních významů (WSD), indukce slovních významů, sémantická klasifikace sloves, kompozicionalita, smysl a reference, pojetí definice a analýzy, sémantické reprezentace vět na základě predikátové logiky a intenční logiky, algoritmus sémantické analýzy - algoritmus normálního překladu, logické a common sense odvozování (argumentace).
- Základní studijní materiál
-
-
J. Eisenstein,
Introduction to Natural Language Processing (2019),
MIT Press,
kap. 12-14 -
R. Mitkov,
The Oxford Handbook of Computational Linguistics 2nd edition (
MU proxy), Oxford University Press
2. vydání 2014-2021: kap. 5, 9, 14, 16, 19, 22, 29, 38-41
1. vydání 2005: kap. 5, 8, 9, 13, 14, 21, 25, 31-33
-
J. Eisenstein,
Introduction to Natural Language Processing (2019),
MIT Press,
- Zkoušející
- doc. RNDr. Aleš Horák, Ph.D., doc. Mgr. Pavel Rychlý, Ph.D.
- Další doporučená literatura
-
- M. Duží et al. Procedural semantics for hyperintensional logic: Foundations and applications of Transparent intensional logic. Springer Science & Business Media, 2010.
- Jurafsky and Martin, Speech and Language Processing (2023, 3rd ed. draft)
- P. Materna, Conceptual Systems, LOGOS Verlag Berlin, 2004.
Pragmatické aspekty komunikace
- Anotace
- Pragmatické aspekty komunikace zahrnují jak teoretickou, tak praktickou analýzu komunikační situace. Kandidát se seznámí s vnější a vnitřní pragmatikou, analýzou diskurzu a s technikami a nástroji používanými pro analýzu textových vztahů (algoritmy pro rozpoznávání anafor, segmentace diskurzu). Kromě toho toto téma zahrnuje vedení dialogu a analýzu emocionálních postojů uživatele jazyka.
- Klíčová slova
- Vnitřní pragmatika, vnější pragmatika, komunikační situace, analýza diskurzu, anafora, anaforické vztahy a jejich rozpoznávání v textu, segmenty v diskurzu a jejich rozpoznávání, dialogové systémy, analýza sentimentu.
- Základní studijní materiál
-
-
J. Eisenstein,
Introduction to Natural Language Processing (2019),
MIT Press,
kap. 15-17 -
R. Mitkov,
The Oxford Handbook of Computational Linguistics 2nd edition (
MU proxy), Oxford University Press
2. vydání 2014-2021: kap. 6-8, 30-34, 43-46, 47-50
1. vydání 2005: kap. 6-7, 15-17, 31, 35-38
-
J. Eisenstein,
Introduction to Natural Language Processing (2019),
MIT Press,
- Zkoušející
- doc. RNDr. Aleš Horák, Ph.D., doc. Mgr. Pavel Rychlý, Ph.D.
- Další doporučená literatura
-
- Mira Ariel. Defining Pragmatics. Cambridge University Press, 2010.
- Jurafsky and Martin, Speech and Language Processing (2023, 3rd ed. draft).
Strojový překlad
- Anotace
- Oblast strojového překladu je aplikační oblastí, v níž se ověřují a testují teoretické poznatky a nástroje získané a vyvinuté v oblasti zpracování přirozeného jazyka jako celku. Automatický překlad frází, vět nebo dokumentů zahrnuje analýzu/kódování textu a generování/dekódování textu. Jakákoli chyba v celém procesu je obvykle ve výsledku jasně viditelná. Uchazeč porozumí struktuře systému strojového překladu, jeho slabým stránkám a možným řešením vzniklých problémů.
- Klíčová slova
- Přístupy ke strojovému překladu - pravidlový, statistický, neuronový; pravidlový strojový překlad - analýza, převod a syntéza; statistický strojový překlad - úloha paralelních korpusů, jazykových modelů; překlad založený na frázích a příkladech; neuronový strojový překlad; vyrovnávání vět a slov; práce se slovy mimo slovní zásobu; hodnocení výsledků strojového překladu - metriky.
- Základní studijní materiál
-
-
J. Eisenstein,
Introduction to Natural Language Processing (2019),
MIT Press,
kap. 18-19 -
P. Koehn, Neural machine translation, Cambridge University Press, 2020,
kap. 3-5, 8-10, 12, 14
-
J. Eisenstein,
Introduction to Natural Language Processing (2019),
MIT Press,
- Zkoušející
- doc. Mgr. Pavel Rychlý, Ph.D., doc. RNDr. Aleš Horák, Ph.D.
- Další doporučená literatura
-
- P. Koehn, Statistical machine translation, Cambridge University Press, 2010.