RIV/00216224:14330/12:00057949 - Building Evaluation Dataset for Textual Entailment in Czech (2012)

Údaje o výsledku

Identifikační kód

RIV/00216224:14330/12:00057949

Název v původním jazyce

Building Evaluation Dataset for Textual Entailment in Czech

Druh

D - Článek ve sborníku

Jazyk

eng - angličtina

Obor

IN - Informatika

Rok uplatnění

2012

Kód důvěrnosti údajů

S - Úplné a pravdivé údaje nepodléhající ochraně podle zvláštních právních předpisů

Počet výskytů výsledku

Údaje z Hodnocení výsledků výzkumných organizací 2014

Výsledek byl hodnocen v Pilíři I

Rozsah vyřazení výsledku

Tento výskyt výsledku není vyřazen

Zařazení výsledku v hodnocení

neu - Výsledky bez bodového hodnocení nebo vyřazené

Skupina oboru v hodnocení

04 - Technické a informatické vědy

Konkrétní způsob(y) hodnocení výsledku

Článek ve sborníku má uvedeno ISBN nebo ISSN, ale to není v databázi Conference Proceedings Citation Index ani v databázi Scopus.

Rozdělení výsledku mezi předkladatele

Organizace	Výzkumná organizace?	Podíl	Body	Body (upravené podle přílohy č. 8 Metodiky)
Masarykova univerzita / Fakulta informatiky	ano	100,0 %	0,000

Tvůrci výsledku

Počet tvůrců celkem

Počet domácích tvůrců

Tvůrce

Nevěřilová Zuzana (státní příslušnost: CZ - Česká republika; A - domácí tvůrce; G - garant výsledku; vedidk: 6670288)

Údaje blíže specifikující výsledek

Popis v původním jazyce

Recognizing textual entailment (RTE) is a subfield of natural language processing (NLP). Currently several RTE systems exist in which some of the subtasks are language independent but some are not. Moreover, large datasets for evaluation are prepared almost exclusively for English language. In this paper we describe methods for obtaining test dataset for RTE in Czech. We have used methods for extracting facts from texts based on corpus templates as well as syntactic parser. Moreover, we have used reading comprehension tests for children and students. The main contribution of this article is the classification of “difficulty levels” for particular RTE questions.

Klíčová slova

textual entailment; evaluation data set; Czech language; paraphrasing

Název sborníku

Sixth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2012

Rozsah stran

53-58

Forma vydání

P - Tištěná verze „print“

ISBN

9788026303138

Počet stran výsledku

Název nakladatele

Tribun EU

Místo vydání

Brno

Místo konání akce

Karlova Studánka

Datum zahájení akce

7.12.2012

Typ akce podle státní příslušnoti účastníků

CST - Celostátní

Údaje o tomto záznamu o výsledku

Předkladatel

Masarykova univerzita / Fakulta informatiky

Dodavatel

MSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT)

Rok sběru

2013

Systémové označení dodávky dat

RIV13-MSM-14330___/02:2

Specifikace

RIV/00216224:14330/12:00057949!RIV13-MSM-14330___

Kontrolní kód

[12108E403048]

Další výskyty tohoto výsledku od stejného předkladatele

Dodáno GA ČR v roce 2013

Záznam s identifikačním kódem RIV/00216224:14330/12:00057949 v dodávce dat RIV13-GA0-14330___/02:2

Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl

Projekt

GAP401/10/0792 - Temporální aspekty znalostí a informací (2010-2012, GA0/GA)

Projekt

LM2010013 - LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (2010-2015, MSM/LM)

S - Specifický výzkum na vysokých školách

I - Instit. podpora na rozvoj výzkumné organizace