Údaje o výsledku |
Identifikační kód | RIV/00216224:14330/11:00049734 |
Název v původním jazyce | Syntactic Analysis Using Finite Patterns: A New Parsing System for Czech |
Druh | D - Článek ve sborníku |
Jazyk | eng - angličtina |
Obor | IN - Informatika |
Rok uplatnění | 2011 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje nepodléhající ochraně podle zvláštních právních předpisů |
Počet výskytů výsledku | 2 |
Údaje z Hodnocení výsledků výzkumných organizací 2014 |
Výsledek byl hodnocen v Pilíři I |
Rozsah vyřazení výsledku | Tento výskyt výsledku není vyřazen |
Zařazení výsledku v hodnocení | D - Článek ve sborníku |
Skupina oboru v hodnocení | 04 - Technické a informatické vědy |
Konkrétní způsob(y) hodnocení výsledku | Výsledek hodnocený již v předchozím hodnocení, body se přebírají |
Bodové ohodnocení | 44,387 |
Faktor korekce | 100,9 % |
Body (upravené podle přílohy č. 8 Metodiky) | 44,799 |
Rozdělení výsledku mezi předkladatele |
Organizace | Výzkumná organizace? | Podíl | Body | Body (upravené podle přílohy č. 8 Metodiky) |
Masarykova univerzita / Fakulta informatiky | ano | 100,0 % | 44,387 | 44,799 |
|
Tvůrci výsledku |
Počet tvůrců celkem | 3 |
Počet domácích tvůrců | 3 |
Tvůrce | Kovář Vojtěch (státní příslušnost: CZ - Česká republika; A - domácí tvůrce; G - garant výsledku; vedidk: 6217850) |
Tvůrce | Horák Aleš (státní příslušnost: CZ - Česká republika; A - domácí tvůrce; vedidk: 3161870) |
Tvůrce | Jakubíček Miloš (státní příslušnost: CZ - Česká republika; A - domácí tvůrce; vedidk: 5837189) |
Údaje blíže specifikující výsledek |
Popis v původním jazyce | Syntactic analysis of natural languages is considered to be one of the basic steps to advanced natural language processing, such as logical analysis or information retrieval with natural language texts. The Czech language can be characterized as a morphologically rich language with a relatively free word order, which further complicates the problem of syntactic analysis. Current parsing systems for Czech fight many problems including low precision or high ambiguity of the parser output. In this paper, we show a new approach to syntactic analysis of free-word-order languages based on the idea of pattern matching linking rules. The system, named SET, is currently developed and tested with the Czech language as a representative of free-word-order languages with very rich morphological system. We briefly mention current approaches and parsing systems for Czech. Then we describe the basic ideas as well as details of SET’s prototype implementation of the pattern matching approach to syntactic analysis. |
Klíčová slova | syntactic analysis; freeword- order languages; an alternative approach; natural language processing |
Název sborníku | Human Language Technology. Challenges for Computer Science and Linguistics |
Rozsah stran | 161-171 |
Počet stran výsledku | 11 |
ISBN | 978-3-642-20094-6 |
Název nakladatele | Springer-Verlag |
Místo vydání | Berlin/Heidelberg |
Místo konání akce | Berlin/Heidelberg |
Rok konání akce | 2011 |
Typ akce podle státní příslušnoti účastníků | WRD - Světová |
Údaje o tomto záznamu o výsledku |
Předkladatel | Masarykova univerzita / Fakulta informatiky |
Dodavatel | GA0 - Grantová agentura České republiky (GA ČR) |
Rok sběru | 2012 |
Systémové označení dodávky dat | RIV12-GA0-14330___/02:1 |
Specifikace | RIV/00216224:14330/11:00049734!RIV12-GA0-14330___ |
Kontrolní kód | [C6CC2E49FCA8] |
Další výskyty tohoto výsledku od stejného předkladatele |
Dodáno MŠMT v roce 2012 | Záznam s identifikačním kódem RIV/00216224:14330/11:00049734 v dodávce dat RIV12-MSM-14330___/01:1 |
Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl |
Projekt | GAP401/10/0792 - Temporální aspekty znalostí a informací (2010-2012, GA0/GA) |
Projekt | LC536 - Centrum komputační lingvistiky (2005-2011, MSM/LC) |
Projekt | 2C06009 - Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (2006-2010, MSM/2C) |
S - Specifický výzkum na vysokých školách |