Organizace U  S Kód
hodnocení
Skupina
oborů
Body
výsledku
Body
upravené
Podíl VOBody VOBody VO
upravené
H14
Masarykova univerzita / Fakulta informatiky1516 neu 400000
Výsledky hodnocení dříve prezentovala speciální podoba stránek výskytů výsledků doplněná informacemi o hodnocení daného výskytu a výsledku. To zde supluji doplněním kopií stránek z rvvi.cz/riv z 18.12.2017 o relevantní údaje z dat H16. Najetí myší na kód či skupinu zobrazí vysvětlující text (u některých vyřazených není k dispozici). Čísla jsou oproti zdroji zaokrouhlena na 3 desetinná místa.

Longest-commonest Match (2015)výskyt výsledku

Identifikační kódRIV/00216224:14330/15:00080952
Název v anglickém jazyceLongest-commonest Match
DruhD - Článek ve sborníku
Jazykeng - angličtina
Obor - skupinaI - Informatika
OborIN - Informatika
Rok uplatnění2015
Kód důvěrnosti údajůS - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů.
Počet výskytů výsledku2
Počet tvůrců celkem4
Počet domácích tvůrců3
Výčet všech uvedených jednotlivých tvůrcůAdam Kilgarriff (státní příslušnost: GB - Spojené království Velké Británie a Severního Irska)
Vít Baisa (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 9652353)
Miloš Jakubíček (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 5837189)
Pavel Rychlý (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 6616844)
Popis výsledku v anglickém jazyceFinding two-word collocations is a well-studied task within natural language processing. The result of this task for a given headword is usually a list of collocations sorted by a salience score. In corpus manager Sketch Engine, these pairs are extractedfrom data using a word sketch grammar relation rules and log-dice statistics resulting in a sorted list of triples . The longest?commonest match is a straightforward extension of these two-word collocations into multiword expressions. The resulting expressions are also very useful for representing the most common realisation of the collocational pair and to facilitate the interpretation of the raw triplet because sometimes, for such a triple, it is not clear from what texts it comes. We present here analgorithm behind the longest?commonest match together with a simple evaluation. The longest?commonest match is already implemented in Sketch Engine.
Klíčová slova oddělená středníkemmultiword expresion; collocation; word sketch; Sketch Engine
Stránka www, na které se nachází výsledekhttps://elex.link/elex2015/proceedings/eLex_2015_26_Kilgarriff+etal.pdf

Údaje o výsledku v závislosti na druhu výsledku

Název sborníkuElectronic lexicography in the 21st century: linking lexical data in the digital age. Proceedings of the eLex 2015 conference, 11-13 August 2015, Herstmonceux Castle, United Kingdom.
ISBN9789619359433
ISSN-
Počet stran výsledku8
Strana od-do397-404
Název nakladateleTrojina, Institute for Applied Slovene Studies
Místo vydáníJlubljana
Místo konání akceHerstmonceux
Datum konání akce2015
Typ akce podle státní příslušnosti účastníkůWRD - Celosvětová
Kód UT WoS článku podle Web of Science-

Ostatní informace o výsledku

PředkladatelMasarykova univerzita / Fakulta informatiky
DodavatelMSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT)
Rok sběru2016
SpecifikaceRIV/00216224:14330/15:00080952!RIV16-MSM-14330___
Datum poslední aktualizace výsledku24.05.2016
Kontrolní číslo191635957

Informace o dalších výskytech výsledku dodaného stejným předkladatelem

Dodáno GA ČR v roce 2016RIV/00216224:14330/15:00080952 v dodávce dat RIV16-GA0-14330___/01:1

Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl

Projekt podporovaný MŠMT v programu 7F7F14047 - Harvesting big text data for under-resourced languages (2014 - 2017)
Projekt podporovaný GA ČR v programu GAGA15-13277S - Hyperintensionální logika pro analýzu přirozeného jazyka (2015 - 2017)
Projekt podporovaný MŠMT v programu LMLM2010013 - LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (2010 - 2015)
Podpora / návaznostiSpecifický výzkum na vysokých školách, poskytovatel MŠMT