Organizace U  S Kód
hodnocení
Skupina
oborů
Body
výsledku
Body
upravené
Podíl VOBody VOBody VO
upravené
H14
Masarykova univerzita / Fakulta informatiky1112 neu 400100
Výsledky hodnocení dříve prezentovala speciální podoba stránek výskytů výsledků doplněná informacemi o hodnocení daného výskytu a výsledku. To zde supluji doplněním kopií stránek z rvvi.cz/riv z 18.12.2017 o relevantní údaje z dat H16. Najetí myší na kód či skupinu zobrazí vysvětlující text (u některých vyřazených není k dispozici). Čísla jsou oproti zdroji zaokrouhlena na 3 desetinná místa.

Building Annotated Corpora without Experts (2011)výskyt výsledku

Identifikační kódRIV/00216224:14330/11:00049482
Název v anglickém jazyceBuilding Annotated Corpora without Experts
DruhD - Článek ve sborníku
Jazykeng - angličtina
Obor - skupinaI - Informatika
OborIN - Informatika
Rok uplatnění2011
Kód důvěrnosti údajůS - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů.
Počet výskytů výsledku2
Počet tvůrců celkem1
Počet domácích tvůrců1
Výčet všech uvedených jednotlivých tvůrcůMarek Grác (státní příslušnost: SK - Slovenská republika, domácí tvůrce: A, vedidk: 8666865)
Popis výsledku v anglickém jazyceIn this paper, we present a low-cost approach of building a multi-purpose language resource for Czech, based on currently available results of previous work done by various teams. We focus on the first phase that consists of verifying validity of automatically discovered syntactic elements in 10 000 sentences by 47 human annotators. Due to the number of annotators and very limited time for training, existing heavy-weight techniques for building annotated corpora were not applicable. We have decided to avoid using experts when results between annotators differed. This means that our corpus does not offer ultimate answers, but raw data and models for obtaining ``correct'' answer tailored to user's application. Finally we discuss the currently achieved results and future plans.
Klíčová slova oddělená středníkemcorpus annotation crowdsourcing
Stránka www, na které se nachází výsledek-

Údaje o výsledku v závislosti na druhu výsledku

Název sborníkuNatural Language Processing, Multilinguality
ISBN978-80-263-0049-6
ISSN-
Počet stran výsledku8
Strana od-do81-88
Název nakladateleSlovak National Corpus
Místo vydáníBratislava, Slovensko
Místo konání akce2011
Datum konání akce2011
Typ akce podle státní příslušnosti účastníkůEUR - Evropská
Kód UT WoS článku podle Web of Science-

Ostatní informace o výsledku

PředkladatelMasarykova univerzita / Fakulta informatiky
DodavatelAV0 - Akademie věd České republiky (AV ČR)
Rok sběru2012
SpecifikaceRIV/00216224:14330/11:00049482!RIV12-AV0-14330___
Datum poslední aktualizace výsledku17.05.2012
Kontrolní číslo13491755

Informace o dalších výskytech výsledku dodaného stejným předkladatelem

Dodáno MŠMT v roce 2012RIV/00216224:14330/11:00049482 v dodávce dat RIV12-MSM-14330___/01:1

Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl

Projekt podporovaný AV ČR v programu 1E1ET100300419 - Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu (2004 - 2008)
Projekt podporovaný MŠMT v programu LCLC536 - Integrované centrum počítačového zpracování přirozeného jazyka (2005 - 2009)
Podpora / návaznostiSpecifický výzkum na vysokých školách, poskytovatel MŠMT