Building Evaluation Dataset for Textual Entailment in Czech (2012)výskyt výsledku
Identifikační kód | RIV/00216224:14330/12:00057949 |
---|---|
Název v anglickém jazyce | Building Evaluation Dataset for Textual Entailment in Czech |
Druh | D - Článek ve sborníku |
Jazyk | eng - angličtina |
Obor - skupina | I - Informatika |
Obor | IN - Informatika |
Rok uplatnění | 2012 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů. |
Počet výskytů výsledku | 2 |
Počet tvůrců celkem | 1 |
Počet domácích tvůrců | 1 |
Výčet všech uvedených jednotlivých tvůrců | Zuzana Nevěřilová (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 6670288) |
Popis výsledku v anglickém jazyce | Recognizing textual entailment (RTE) is a subfield of natural language processing (NLP). Currently several RTE systems exist in which some of the subtasks are language independent but some are not. Moreover, large datasets for evaluation are prepared almost exclusively for English language. In this paper we describe methods for obtaining test dataset for RTE in Czech. We have used methods for extracting facts from texts based on corpus templates as well as syntactic parser. Moreover, we have used reading comprehension tests for children and students. The main contribution of this article is the classification of ?difficulty levels? for particular RTE questions. |
Klíčová slova oddělená středníkem | textual entailment; evaluation data set; Czech language; paraphrasing |
Stránka www, na které se nachází výsledek | - |
Údaje o výsledku v závislosti na druhu výsledku
Název sborníku | Sixth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2012 |
---|---|
ISBN | 9788026303138 |
ISSN | - |
Počet stran výsledku | 6 |
Strana od-do | 53-58 |
Název nakladatele | Tribun EU |
Místo vydání | Brno |
Místo konání akce | Karlova Studánka |
Datum konání akce | 07.12.2012 |
Typ akce podle státní příslušnosti účastníků | CST - Celostátní |
Kód UT WoS článku podle Web of Science | - |
Ostatní informace o výsledku
Předkladatel | Masarykova univerzita / Fakulta informatiky |
---|---|
Dodavatel | GA0 - Grantová agentura České republiky (GA ČR) |
Rok sběru | 2013 |
Specifikace | RIV/00216224:14330/12:00057949!RIV13-GA0-14330___ |
Datum poslední aktualizace výsledku | 04.09.2013 |
Kontrolní číslo | 43537292 |
Informace o dalších výskytech výsledku dodaného stejným předkladatelem
Dodáno MŠMT v roce 2013 | RIV/00216224:14330/12:00057949 v dodávce dat RIV13-MSM-14330___/02:2 |
---|
Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl
Projekt podporovaný GA ČR v programu GA | GAP401/10/0792 - Temporální aspekty znalostí a informací (2010 - 2012) |
---|---|
Projekt podporovaný MŠMT v programu LM | LM2010013 - LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (2010 - 2015) |
Podpora / návaznosti | Institucionální podpora na rozvoj výzkumné organizace Specifický výzkum na vysokých školách, poskytovatel MŠMT |