Organizace U  S Kód
hodnocení
Skupina
oborů
Body
výsledku
Body
upravené
Podíl VOBody VOBody VO
upravené
H14
Masarykova univerzita / Fakulta informatiky1112 neu 400100
Výsledky hodnocení dříve prezentovala speciální podoba stránek výskytů výsledků doplněná informacemi o hodnocení daného výskytu a výsledku. To zde supluji doplněním kopií stránek z rvvi.cz/riv z 18.12.2017 o relevantní údaje z dat H16. Najetí myší na kód či skupinu zobrazí vysvětlující text (u některých vyřazených není k dispozici). Čísla jsou oproti zdroji zaokrouhlena na 3 desetinná místa.

Anotácia dát (2011)výskyt výsledku

Identifikační kódRIV/00216224:14330/11:00051849
Název v původním jazyceAnotácia dát
Název v anglickém jazyceData Annotation
DruhD - Článek ve sborníku
Jazyksla - slovenština
Obor - skupinaI - Informatika
OborIN - Informatika
Rok uplatnění2011
Kód důvěrnosti údajůS - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů.
Počet výskytů výsledku1
Počet tvůrců celkem2
Počet domácích tvůrců2
Výčet všech uvedených jednotlivých tvůrcůAdam Rambousek (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 5798809)
Marek Grác (státní příslušnost: SK - Slovenská republika, domácí tvůrce: A, vedidk: 8666865)
Popis výsledku v původním jazycePráca s prirodzeným jazykom vyžaduje rozsiahle dátové zdroje -- korpusy. Čím viac informácií z nich dokážeme extrahovať, tým sú pre nás užitočnejšie. Niektoré úlohy však nie je možné kvalitne značkovať pomocou automatických nástrojov. V našom príspevku sa venujeme problematike manuálneho resp. poloautomatického značkovania jazykových zdrojov. Reflektujeme v nich skúsenosti získané z viacerých projektov, ktoré sa líšili množstvom anotátorov, ich skúsenosťami, druhom anotovaných dát a v neposlednej rade aj kvalitou anotátorov.
Popis výsledku v anglickém jazyceNatural language processing needs large data resources -- corpora. The more information we can extract, the more useful they are. However it is not possible to annotate some information automatically in good quality. This paper deals with manual and semi-automatical annotation of language resources. It summarize the experience from several projects that differ in amount of annotators, their experience, data type and annotator quality.
Klíčová slova oddělená středníkemannotation; corpora; inter-annotator agreement
Stránka www, na které se nachází výsledek-

Údaje o výsledku v závislosti na druhu výsledku

Název sborníkuZnalosti 2011, sborník příspěvků
ISBN978-80-248-2369-0
ISSN-
Počet stran výsledku4
Strana od-do263-266
Název nakladateleFakulta elektrotechniky a informatiky, VŠB-Technická univerzita Ostrava
Místo vydáníOstrava
Místo konání akceStará Lesná
Datum konání akce31.01.2011
Typ akce podle státní příslušnosti účastníkůWRD - Celosvětová
Kód UT WoS článku podle Web of Science-

Ostatní informace o výsledku

PředkladatelMasarykova univerzita / Fakulta informatiky
DodavatelMSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT)
Rok sběru2012
SpecifikaceRIV/00216224:14330/11:00051849!RIV12-MSM-14330___
Datum poslední aktualizace výsledku07.05.2012
Kontrolní číslo13243019

Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl

Projekt podporovaný MŠMT v programu LCLC536 - Integrované centrum počítačového zpracování přirozeného jazyka (2005 - 2009)
Podpora / návaznostiSpecifický výzkum na vysokých školách, poskytovatel MŠMT