RIV/00216224:14330/12:00057949 - Building Evaluation Dataset for Textual Entailment in Czech (2012)

Údaje o výsledku
Identifikační kódRIV/00216224:14330/12:00057949
Název v původním jazyceBuilding Evaluation Dataset for Textual Entailment in Czech
DruhD - Článek ve sborníku
Jazykeng - angličtina
OborIN - Informatika
Rok uplatnění2012
Kód důvěrnosti údajůS - Úplné a pravdivé údaje nepodléhající ochraně podle zvláštních právních předpisů
Počet výskytů výsledku2
Údaje z Hodnocení výsledků výzkumných organizací 2014
Výsledek byl hodnocen v Pilíři I
Rozsah vyřazení výsledkuTento výskyt výsledku není vyřazen
Zařazení výsledku v hodnoceníneu - Výsledky bez bodového hodnocení nebo vyřazené
Skupina oboru v hodnocení04 - Technické a informatické vědy
Konkrétní způsob(y) hodnocení výsledkuČlánek ve sborníku má uvedeno ISBN nebo ISSN, ale to není v databázi Conference Proceedings Citation Index ani v databázi Scopus.
Rozdělení výsledku mezi předkladatele
OrganizaceVýzkumná organizace?PodílBodyBody (upravené podle přílohy č. 8 Metodiky)
Masarykova univerzita / Fakulta informatikyano100,0 %0,000
Tvůrci výsledku
Počet tvůrců celkem1
Počet domácích tvůrců1
TvůrceNevěřilová Zuzana (státní příslušnost: CZ - Česká republika; A - domácí tvůrce; G - garant výsledku; vedidk: 6670288)
Údaje blíže specifikující výsledek
Popis v původním jazyceRecognizing textual entailment (RTE) is a subfield of natural language processing (NLP). Currently several RTE systems exist in which some of the subtasks are language independent but some are not. Moreover, large datasets for evaluation are prepared almost exclusively for English language. In this paper we describe methods for obtaining test dataset for RTE in Czech. We have used methods for extracting facts from texts based on corpus templates as well as syntactic parser. Moreover, we have used reading comprehension tests for children and students. The main contribution of this article is the classification of “difficulty levels” for particular RTE questions.
Klíčová slovatextual entailment; evaluation data set; Czech language; paraphrasing
Název sborníkuSixth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2012
Rozsah stran53-58
Forma vydáníP - Tištěná verze „print“
ISBN9788026303138
Počet stran výsledku6
Název nakladateleTribun EU
Místo vydáníBrno
Místo konání akceKarlova Studánka
Datum zahájení akce7.12.2012
Typ akce podle státní příslušnoti účastníkůCST - Celostátní
Údaje o tomto záznamu o výsledku
PředkladatelMasarykova univerzita / Fakulta informatiky
DodavatelMSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT)
Rok sběru2013
Systémové označení dodávky datRIV13-MSM-14330___/02:2
SpecifikaceRIV/00216224:14330/12:00057949!RIV13-MSM-14330___
Kontrolní kód[12108E403048]
Další výskyty tohoto výsledku od stejného předkladatele
Dodáno GA ČR v roce 2013Záznam s identifikačním kódem RIV/00216224:14330/12:00057949 v dodávce dat RIV13-GA0-14330___/02:2
Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl
ProjektGAP401/10/0792 - Temporální aspekty znalostí a informací (2010-2012, GA0/GA)
ProjektLM2010013 - LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (2010-2015, MSM/LM)
S - Specifický výzkum na vysokých školách
I - Instit. podpora na rozvoj výzkumné organizace