Organizace U  S Kód
hodnocení
Skupina
oborů
Body
výsledku
Body
upravené
Podíl VOBody VOBody VO
upravené
H14
Masarykova univerzita / Fakulta informatiky1112 neu 100100
Výsledky hodnocení dříve prezentovala speciální podoba stránek výskytů výsledků doplněná informacemi o hodnocení daného výskytu a výsledku. To zde supluji doplněním kopií stránek z rvvi.cz/riv z 18.12.2017 o relevantní údaje z dat H16. Najetí myší na kód či skupinu zobrazí vysvětlující text (u některých vyřazených není k dispozici). Čísla jsou oproti zdroji zaokrouhlena na 3 desetinná místa.

Extrakce korpusových příkladů pro valenční slovník (2011)výskyt výsledku

Identifikační kódRIV/00216224:14330/11:00053271
Název v původním jazyceExtrakce korpusových příkladů pro valenční slovník
Název v anglickém jazyceExtraction of Corpus Examples for Valency Lexicon
DruhD - Článek ve sborníku
Jazykcze - čeština
Obor - skupinaA - Společenské vědy
OborAI - Jazykověda
Rok uplatnění2011
Kód důvěrnosti údajůS - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů.
Počet výskytů výsledku1
Počet tvůrců celkem1
Počet domácích tvůrců1
Výčet všech uvedených jednotlivých tvůrcůVít Baisa (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 9652353)
Popis výsledku v původním jazyceValenční slovník VerbaLex je vytvářen na základě několika různých zdrojů, mezi nimiž chybí reálná korpusová data. V současné době obsahuje VerbaLex asi 10 000 slovesných lemmat, 20 000 literálů (dvojice sloveso a jeho význam) a zhruba stejný počet valenčních rámců. Ve většině případů byly příklady pro jednotlivé valenční rámce vymyšleny. Naším cílem je doplnit tento bohatý lexikografický zdroj o reálné příklady z korpusu. Článek popisuje proceduru, při níž se valenční rámce VerbaLexu transformují na dotazy v jazyce CQL, které slouží pro hledání příkladů reálných vět pro daný valenční rámec. Tato procedura je jednoduchá, ale relativně účinná. V článku se podrobně věnujeme jednotlivým krokům procedury, výsledkům, jejich kvalitě a obtížím, na které jsme při vyhledávání realizací valenčních rámců v korpusu narazili.
Popis výsledku v anglickém jazyceValency lexicon VerbaLex is built on the basis of various lexical sources. Unfortunately, real corpus data is missing among them. Currently, VerbaLex contains about 1O,OOO verb lemmata, 20,000 literals (lemmata with their sense-numbers) and roughly the same amount of valency frames. In most cases, examples for individual valency frames were made up artificially. Our goal is to add real examples from a corpus to this rich lexicographic source. The article summarizes a procedure which tranforms valency frames into CQL queries. These queries then serves for searching of real sentences corresponding with the transformed valency frames. The procedure is simple and relatively effective and is followed by necessary manual selection of acceptable examples. Wedescribe in detail all steps of the procedure, results, their quality and obstacles we have faced during the extraction of examples of valency frames.
Klíčová slova oddělená středníkemvalency lexicon; VerbaLex; corpus; valency frame; CQL
Stránka www, na které se nachází výsledek-

Údaje o výsledku v závislosti na druhu výsledku

Název sborníkuKorpusová lingvistika, 3: Gramatika a značkování korpusů
ISBN978-80-7422-116-3
ISSN-
Počet stran výsledku11
Strana od-do110-120
Název nakladateleNakladatelství Lidové noviny
Místo vydáníPraha
Místo konání akcePraha
Datum konání akce2011
Typ akce podle státní příslušnosti účastníkůEUR - Evropská
Kód UT WoS článku podle Web of Science-

Ostatní informace o výsledku

PředkladatelMasarykova univerzita / Fakulta informatiky
DodavatelMSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT)
Rok sběru2012
SpecifikaceRIV/00216224:14330/11:00053271!RIV12-MSM-14330___
Datum poslední aktualizace výsledku07.05.2012
Kontrolní číslo13243487

Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl

Projekt podporovaný MŠMT v programu LCLC536 - Integrované centrum počítačového zpracování přirozeného jazyka (2005 - 2009)
Podpora / návaznostiSpecifický výzkum na vysokých školách, poskytovatel MŠMT