RIV/00216224:14330/11:00049482 - Building Annotated Corpora without Experts (2011)

Údaje o výsledku
Identifikační kódRIV/00216224:14330/11:00049482
Název v původním jazyceBuilding Annotated Corpora without Experts
DruhD - Článek ve sborníku
Jazykeng - angličtina
OborIN - Informatika
Rok uplatnění2011
Kód důvěrnosti údajůS - Úplné a pravdivé údaje nepodléhající ochraně podle zvláštních právních předpisů
Počet výskytů výsledku2
Údaje z Hodnocení výsledků výzkumných organizací 2014
Výsledek byl hodnocen v Pilíři I
Rozsah vyřazení výsledkuTento výskyt výsledku není vyřazen
Zařazení výsledku v hodnoceníneu - Výsledky bez bodového hodnocení nebo vyřazené
Skupina oboru v hodnocení04 - Technické a informatické vědy
Konkrétní způsob(y) hodnocení výsledkuČlánek ve sborníku má uvedeno ISBN nebo ISSN, ale to není v databázi Conference Proceedings Citation Index ani v databázi Scopus.
Rozdělení výsledku mezi předkladatele
OrganizaceVýzkumná organizace?PodílBodyBody (upravené podle přílohy č. 8 Metodiky)
Masarykova univerzita / Fakulta informatikyano100,0 %0,000
Tvůrci výsledku
Počet tvůrců celkem1
Počet domácích tvůrců1
TvůrceGrác Marek (státní příslušnost: SK - Slovenská republika; A - domácí tvůrce; G - garant výsledku; vedidk: 8666865)
Údaje blíže specifikující výsledek
Popis v původním jazyceIn this paper, we present a low-cost approach of building a multi-purpose language resource for Czech, based on currently available results of previous work done by various teams. We focus on the first phase that consists of verifying validity of automatically discovered syntactic elements in 10 000 sentences by 47 human annotators. Due to the number of annotators and very limited time for training, existing heavy-weight techniques for building annotated corpora were not applicable. We have decided to avoid using experts when results between annotators differed. This means that our corpus does not offer ultimate answers, but raw data and models for obtaining ``correct'' answer tailored to user's application. Finally we discuss the currently achieved results and future plans.
Klíčová slovacorpus annotation crowdsourcing
Název sborníkuNatural Language Processing, Multilinguality
Rozsah stran81-88
ISBN978-80-263-0049-6
Počet stran výsledku8
Název nakladateleSlovak National Corpus
Místo vydáníBratislava, Slovensko
Místo konání akce2011
Rok konání akce2011
Typ akce podle státní příslušnoti účastníkůEUR - Evropská
Údaje o tomto záznamu o výsledku
PředkladatelMasarykova univerzita / Fakulta informatiky
DodavatelMSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT)
Rok sběru2012
Systémové označení dodávky datRIV12-MSM-14330___/01:1
SpecifikaceRIV/00216224:14330/11:00049482!RIV12-MSM-14330___
Kontrolní kód[A624FB185991]
Další výskyty tohoto výsledku od stejného předkladatele
Dodáno AV ČR v roce 2012Záznam s identifikačním kódem RIV/00216224:14330/11:00049482 v dodávce dat RIV12-AV0-14330___/01:1
Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl
ProjektLC536 - Centrum komputační lingvistiky (2005-2011, MSM/LC)
Projekt1ET100300419 - Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu (2004-2008, AV0/1E)
S - Specifický výzkum na vysokých školách