Identifikační kód | RIV/00216224:14330/13:00070350 |
Název v anglickém jazyce | Acquiring Data for Textual Entailment Recognition |
Druh | D - Článek ve sborníku |
Jazyk | eng - angličtina |
Obor - skupina | I - Informatika |
Obor | IN - Informatika |
Rok uplatnění | 2013 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů. |
Počet výskytů výsledku | 1 |
Počet tvůrců celkem | 1 |
Počet domácích tvůrců | 1 |
Výčet všech uvedených jednotlivých tvůrců | Zuzana Nevěřilová (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 6670288) |
Popis výsledku v anglickém jazyce | Language resources are hardly ever large enough. Building language resources that can be used as a gold standard for semantic analysis requires effort and investment. We present a prototype for acquiring language resources by means of a language game which is a cheap but long-term method. Games employed to acquire language resources are not new. For example games with a purpose are used for collecting common sense knowledge. The game presented in this paper is a work in progress. It collects annotated pairs text?hypothesis suitable for recognizing textual entailment in Czech. The game narrative is based on Sherlock Holmes and dr. Watson dialogues. For generating the dialogue line we use rule-based approaches such as syntactic analysis, anaphora resolution, synonym and hypernym replacement, word order rearrangement and verb frame based inference. To generate natural sounding sentences we added a language model score (based on n-gram frequencies in a corpus). |
Klíčová slova oddělená středníkem | extual entailment; language game; games with a purpose; GWAP |
Stránka www, na které se nachází výsledek | - |