SemEval-2015 Task 15: A CPA dictionary-entry-building task (2015)výskyt výsledku
Identifikační kód | RIV/00216224:14330/15:00083584 |
---|---|
Název v anglickém jazyce | SemEval-2015 Task 15: A CPA dictionary-entry-building task |
Druh | D - Článek ve sborníku |
Jazyk | eng - angličtina |
Obor - skupina | I - Informatika |
Obor | IN - Informatika |
Rok uplatnění | 2015 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů. |
Počet výskytů výsledku | |
Počet tvůrců celkem | 6 |
Počet domácích tvůrců | 1 |
Výčet všech uvedených jednotlivých tvůrců | Vít Baisa (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 9652353) Jane Bradbury (státní příslušnost: GB - Spojené království Velké Británie a Severního Irska) Silvie Cinková (státní příslušnost: CZ - Česká republika) Isma?l El Maarouf (státní příslušnost: FR - Francouzská republika) Adam Kilgarriff (státní příslušnost: GB - Spojené království Velké Británie a Severního Irska) Octavian Popescu (státní příslušnost: RO - Rumunsko) |
Popis výsledku v anglickém jazyce | This paper describes the first SemEval task to explore the use of Natural Language Processing systems for building dictionary entries, in the framework of Corpus Pattern Analysis. CPA is a corpus-driven technique which provides tools and resources to identify and represent unambiguously the main semantic patterns in which words are used. Task 15 draws on the Pattern Dictionary of English Verbs (www.pdev.org.uk), for the targeted lexical entries, and on the British National Corpus for the input text. Dictionary entry building is split into three subtasks which all start from the same concordance sample: 1) CPA parsing, where arguments and their syntactic and semantic categories have to be identified, 2) CPA clustering, in which sentences with similar patterns have to be clustered and 3) CPA automatic lexicography where the structure of patterns have to be constructed automatically. Subtask 1 attracted 3 teams, though none could beat the baseline (rule-based system). |
Klíčová slova oddělená středníkem | semeval;corpus pattern analysis;concordance clustering;semantic evaluation |
Stránka www, na které se nachází výsledek | - |
Údaje o výsledku v závislosti na druhu výsledku
Název sborníku | Proceedings of the 9th International Workshop on Semantic Evaluation (SemEval 2015) |
---|---|
ISBN | 9781941643402 |
ISSN | - |
Počet stran výsledku | 10 |
Strana od-do | 315-324 |
Název nakladatele | Association for Computational Linguistics |
Místo vydání | Denver, Colorado |
Místo konání akce | Denver, Colorado, USA |
Datum konání akce | 2015 |
Typ akce podle státní příslušnosti účastníků | WRD - Celosvětová |
Kód UT WoS článku podle Web of Science | - |
Ostatní informace o výsledku
Předkladatel | Masarykova univerzita / Fakulta informatiky |
---|---|
Dodavatel | MSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT) |
Rok sběru | 2016 |
Specifikace | RIV/00216224:14330/15:00083584!RIV16-MSM-14330___ |
Datum poslední aktualizace výsledku | 02.06.2017 |
Kontrolní číslo | 191954304 |
Informace o dalších výskytech výsledku dodaného ostatními předkladateli
Dodáno GA ČR v roce 2016 | RIV/00216208:11320/15:10318123 v dodávce dat RIV16-GA0-11320___/01:1 předkladatelem Univerzita Karlova v Praze / Matematicko-fyzikální fakulta |
---|---|
Dodáno MŠMT v roce 2016 | RIV/00216208:11320/15:10318123 v dodávce dat RIV16-MSM-11320___/01:1 předkladatelem Univerzita Karlova v Praze / Matematicko-fyzikální fakulta |
Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl
Projekt podporovaný MŠMT v programu 7F | 7F14047 - Harvesting big text data for under-resourced languages (2014 - 2017) |
---|---|
Projekt podporovaný MŠMT v programu LM | LM2010013 - LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (2010 - 2015) |
Podpora / návaznosti | Specifický výzkum na vysokých školách, poskytovatel MŠMT |