Vyhledávání ve výsledcích Hodnocení 2016

Organizace	U	S	Kód hodnocení	Skupina oborů	Body výsledku	Body upravené	Podíl VO	Body VO	Body VO upravené	H14
Masarykova univerzita / Fakulta informatiky	11	12	neu	1	0	0	1	0	0	→

Výsledky hodnocení dříve prezentovala speciální podoba stránek výskytů výsledků doplněná informacemi o hodnocení daného výskytu a výsledku. To zde supluji doplněním kopií stránek z rvvi.cz/riv z 18.12.2017 o relevantní údaje z dat H16. Najetí myší na kód či skupinu zobrazí vysvětlující text (u některých vyřazených není k dispozici). Čísla jsou oproti zdroji zaokrouhlena na 3 desetinná místa.

Extrakce korpusových příkladů pro valenční slovník (2011)výskyt výsledku

Identifikační kód	RIV/00216224:14330/11:00053271
Název v původním jazyce	Extrakce korpusových příkladů pro valenční slovník
Název v anglickém jazyce	Extraction of Corpus Examples for Valency Lexicon
Druh	D - Článek ve sborníku
Jazyk	cze - čeština
Obor - skupina	A - Společenské vědy
Obor	AI - Jazykověda
Rok uplatnění	2011
Kód důvěrnosti údajů	S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů.
Počet výskytů výsledku	1
Počet tvůrců celkem	1
Počet domácích tvůrců	1
Výčet všech uvedených jednotlivých tvůrců	Vít Baisa (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 9652353)
Popis výsledku v původním jazyce	Valenční slovník VerbaLex je vytvářen na základě několika různých zdrojů, mezi nimiž chybí reálná korpusová data. V současné době obsahuje VerbaLex asi 10 000 slovesných lemmat, 20 000 literálů (dvojice sloveso a jeho význam) a zhruba stejný počet valenčních rámců. Ve většině případů byly příklady pro jednotlivé valenční rámce vymyšleny. Naším cílem je doplnit tento bohatý lexikografický zdroj o reálné příklady z korpusu. Článek popisuje proceduru, při níž se valenční rámce VerbaLexu transformují na dotazy v jazyce CQL, které slouží pro hledání příkladů reálných vět pro daný valenční rámec. Tato procedura je jednoduchá, ale relativně účinná. V článku se podrobně věnujeme jednotlivým krokům procedury, výsledkům, jejich kvalitě a obtížím, na které jsme při vyhledávání realizací valenčních rámců v korpusu narazili.
Popis výsledku v anglickém jazyce	Valency lexicon VerbaLex is built on the basis of various lexical sources. Unfortunately, real corpus data is missing among them. Currently, VerbaLex contains about 1O,OOO verb lemmata, 20,000 literals (lemmata with their sense-numbers) and roughly the same amount of valency frames. In most cases, examples for individual valency frames were made up artificially. Our goal is to add real examples from a corpus to this rich lexicographic source. The article summarizes a procedure which tranforms valency frames into CQL queries. These queries then serves for searching of real sentences corresponding with the transformed valency frames. The procedure is simple and relatively effective and is followed by necessary manual selection of acceptable examples. Wedescribe in detail all steps of the procedure, results, their quality and obstacles we have faced during the extraction of examples of valency frames.
Klíčová slova oddělená středníkem	valency lexicon; VerbaLex; corpus; valency frame; CQL
Stránka www, na které se nachází výsledek	-

Údaje o výsledku v závislosti na druhu výsledku

Název sborníku	Korpusová lingvistika, 3: Gramatika a značkování korpusů
ISBN	978-80-7422-116-3
ISSN	-
Počet stran výsledku	11
Strana od-do	110-120
Název nakladatele	Nakladatelství Lidové noviny
Místo vydání	Praha
Místo konání akce	Praha
Datum konání akce	2011
Typ akce podle státní příslušnosti účastníků	EUR - Evropská
Kód UT WoS článku podle Web of Science	-

Ostatní informace o výsledku

Předkladatel	Masarykova univerzita / Fakulta informatiky
Dodavatel	MSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT)
Rok sběru	2012
Specifikace	RIV/00216224:14330/11:00053271!RIV12-MSM-14330___
Datum poslední aktualizace výsledku	07.05.2012
Kontrolní číslo	13243487

Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl

Projekt podporovaný MŠMT v programu LC	LC536 - Integrované centrum počítačového zpracování přirozeného jazyka (2005 - 2009)
Podpora / návaznosti	Specifický výzkum na vysokých školách, poskytovatel MŠMT