Údaje o výsledku |
Identifikační kód | RIV/00216224:14330/12:00057392 |
Název v původním jazyce | Finding Multiwords of More Than Two Words |
Druh | D - Článek ve sborníku |
Jazyk | eng - angličtina |
Obor | AI - Jazykověda |
Rok uplatnění | 2012 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje nepodléhající ochraně podle zvláštních právních předpisů |
Počet výskytů výsledku | 2 |
Údaje z Hodnocení výsledků výzkumných organizací 2014 |
Výsledek byl hodnocen v Pilíři I |
Rozsah vyřazení výsledku | Tento výskyt výsledku není vyřazen |
Zařazení výsledku v hodnocení | neu - Výsledky bez bodového hodnocení nebo vyřazené |
Skupina oboru v hodnocení | 01 - Společenské, humanitní a umělecké vědy - SHVa |
Konkrétní způsob(y) hodnocení výsledku | Článek ve sborníku má uvedeno ISBN nebo ISSN, ale to není v databázi Conference Proceedings Citation Index ani v databázi Scopus. |
Rozdělení výsledku mezi předkladatele |
Organizace | Výzkumná organizace? | Podíl | Body | Body (upravené podle přílohy č. 8 Metodiky) |
Masarykova univerzita / Fakulta informatiky | ano | 85,7 % | 0,000 | |
|
Tvůrci výsledku |
Počet tvůrců celkem | 4 |
Počet domácích tvůrců | 3 |
Tvůrce | Kilgarriff Adam (státní příslušnost: GB - Spojené království Velké Británie a Severního Irska; G - garant výsledku) |
Tvůrce | Rychlý Pavel (státní příslušnost: CZ - Česká republika; A - domácí tvůrce; vedidk: 6616844) |
Tvůrce | Kovář Vojtěch (státní příslušnost: CZ - Česká republika; A - domácí tvůrce; vedidk: 6217850) |
Tvůrce | Baisa Vít (státní příslušnost: CZ - Česká republika; A - domácí tvůrce; vedidk: 9652353) |
Údaje blíže specifikující výsledek |
Popis v původním jazyce | The prospects for automatically identifying two-word multiwords in corpora have been explored in depth, and there are now well-established methods in widespread use. (We use "multiwords" to include collocations, colligations, idioms and set phrases etc.) But many multiwords are of more than two words and research for items of three and more words has been less successful. We present three complementary strategies, all implemented and available in the Sketch Engine. The first, "multiword sketches", starts from the word sketch for a word and lets a user click on a collocate to see the third words that go with the node and collocate. In the word sketch for take, one collocate is care. We can click on that to find ensure, avoid: take care to ensure, take care to avoid. The second, "commonest match", will find these full expressions, including the to. |
Klíčová slova | collocations; multiword expressions; multiwords; corpus lexicography; word sketches |
Rozsah stran | 693-700 |
Název sborníku | Proceedings of the 15th EURALEX International Congress |
Forma vydání | P - Tištěná verze „print“ |
ISBN | 9788230320952 |
Počet stran výsledku | 7 |
Název nakladatele | Department of Linguistics and Scandinavian Studies, University of Oslo |
Místo vydání | Oslo |
Místo konání akce | Oslo |
Rok konání akce | 2012 |
Typ akce podle státní příslušnoti účastníků | WRD - Světová |
Údaje o tomto záznamu o výsledku |
Předkladatel | Masarykova univerzita / Fakulta informatiky |
Dodavatel | MSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT) |
Rok sběru | 2013 |
Systémové označení dodávky dat | RIV13-MSM-14330___/02:2 |
Specifikace | RIV/00216224:14330/12:00057392!RIV13-MSM-14330___ |
Kontrolní kód | [0B84638A7305] |
Další výskyty tohoto výsledku od stejného předkladatele |
Dodáno GA ČR v roce 2013 | Záznam s identifikačním kódem RIV/00216224:14330/12:00057392 v dodávce dat RIV13-GA0-14330___/02:2 |
Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl |
Projekt | GAP401/10/0792 - Temporální aspekty znalostí a informací (2010-2012, GA0/GA) |
Projekt | LM2010013 - LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (2010-2015, MSM/LM) |
S - Specifický výzkum na vysokých školách |