Přeloženo pomocí DeepL

Stránka přeložená strojově pro lepší dosažitelnost obsahu tazateli užívajícími češtinu.

Zpracování přirozeného jazyka

Zpracování přirozeného jazyka neboli NLP pokrývá podstatnou část celého oboru umělé inteligence - interakci člověka s počítačem, pokročilé zpracování informací, automatizované uvažování nebo strojový překlad mezi lidskými jazyky i logickými formalismy jako "počítačovými" jazyky.

  1. Formální struktura přirozeného jazyka
  2. Reprezentace znalostí a uvažování
  3. Pragmatické aspekty komunikace
  4. Strojový překlad

Formální struktura přirozeného jazyka

Anotace
Formální popis přirozeného jazyka je často založen na úrovních lingvistické analýzy (morfologické, syntaktické a sémantické). Uchazeč se seznámí se základními teoretickými přístupy a koncepty ve vztahu k jednotlivým úrovním analýzy (konečné automaty, formální gramatiky, logické formalismy atd.) a také s konstrukcí standardních nástrojů (morfologické analyzátory, parsery).
Klíčová slova
Základní jednotky morfologické úrovně, algoritmický popis (české) morfologie, nástroje morfologické analýzy (tagger, lemmatizátor, guesser), formální gramatiky přirozeného jazyka, pravidla a struktury, typy gramatik (CFG, CCG, HPSG, LTAG, LFG), (slovní) valenční rámce (povrchové a hloubkové), parsery a syntaktické analyzátory (statistické, pravidlové, parsování grafů, částečné parsování/chunking).
Základní studijní materiál
Zkoušející
doc. RNDr. Aleš Horák, Ph.D., doc. Mgr. Pavel Rychlý, Ph.D.
Další doporučená literatura

Reprezentace znalostí a uvažování

Anotace
Reprezentace významu a odvozování nových znalostí jsou základními oblastmi v oblasti počítačového zpracování jazyka. Uchazeč se seznámí s lexikální a logickou sémantikou a s technikami a nástroji používanými k zachycení významu slov a slovních spojení (definice významu, systémy elektronických slovníků, sémantické sítě, ontologie). Logická analýza vět přirozeného jazyka zahrnuje zvládnutí logických formalismů a nástrojů, které je používají (normální překladový algoritmus).
Klíčová slova
Lexikální význam slov a frází (kolokace), sémantické sítě, rámce, ontologie, disambiguace slovních významů (WSD), indukce slovních významů, sémantická klasifikace sloves, kompozicionalita, smysl a reference, pojetí definice a analýzy, sémantické reprezentace vět na základě predikátové logiky a intenční logiky, algoritmus sémantické analýzy - algoritmus normálního překladu, logické a common sense odvozování (argumentace).
Základní studijní materiál
Zkoušející
doc. RNDr. Aleš Horák, Ph.D., doc. Mgr. Pavel Rychlý, Ph.D.
Další doporučená literatura
  • M. Duží et al. Procedural semantics for hyperintensional logic: Foundations and applications of Transparent intensional logic. Springer Science & Business Media, 2010.
  • Jurafsky and Martin, Speech and Language Processing (2023, 3rd ed. draft)
  • P. Materna, Conceptual Systems, LOGOS Verlag Berlin, 2004.

Pragmatické aspekty komunikace

Anotace
Pragmatické aspekty komunikace zahrnují jak teoretickou, tak praktickou analýzu komunikační situace. Kandidát se seznámí s vnější a vnitřní pragmatikou, analýzou diskurzu a s technikami a nástroji používanými pro analýzu textových vztahů (algoritmy pro rozpoznávání anafor, segmentace diskurzu). Kromě toho toto téma zahrnuje vedení dialogu a analýzu emocionálních postojů uživatele jazyka.
Klíčová slova
Vnitřní pragmatika, vnější pragmatika, komunikační situace, analýza diskurzu, anafora, anaforické vztahy a jejich rozpoznávání v textu, segmenty v diskurzu a jejich rozpoznávání, dialogové systémy, analýza sentimentu.
Základní studijní materiál
Zkoušející
doc. RNDr. Aleš Horák, Ph.D., doc. Mgr. Pavel Rychlý, Ph.D.
Další doporučená literatura

Strojový překlad

Anotace
Oblast strojového překladu je aplikační oblastí, v níž se ověřují a testují teoretické poznatky a nástroje získané a vyvinuté v oblasti zpracování přirozeného jazyka jako celku. Automatický překlad frází, vět nebo dokumentů zahrnuje analýzu/kódování textu a generování/dekódování textu. Jakákoli chyba v celém procesu je obvykle ve výsledku jasně viditelná. Uchazeč porozumí struktuře systému strojového překladu, jeho slabým stránkám a možným řešením vzniklých problémů.
Klíčová slova
Přístupy ke strojovému překladu - pravidlový, statistický, neuronový; pravidlový strojový překlad - analýza, převod a syntéza; statistický strojový překlad - úloha paralelních korpusů, jazykových modelů; překlad založený na frázích a příkladech; neuronový strojový překlad; vyrovnávání vět a slov; práce se slovy mimo slovní zásobu; hodnocení výsledků strojového překladu - metriky.
Základní studijní materiál
Zkoušející
doc. Mgr. Pavel Rychlý, Ph.D., doc. RNDr. Aleš Horák, Ph.D.
Další doporučená literatura
  • P. Koehn, Statistical machine translation, Cambridge University Press, 2010.