Organizace U  S Kód
hodnocení
Skupina
oborů
Body
výsledku
Body
upravené
Podíl VOBody VOBody VO
upravené
H14
Masarykova univerzita / Fakulta informatiky1213 neu 400100
Výsledky hodnocení dříve prezentovala speciální podoba stránek výskytů výsledků doplněná informacemi o hodnocení daného výskytu a výsledku. To zde supluji doplněním kopií stránek z rvvi.cz/riv z 18.12.2017 o relevantní údaje z dat H16. Najetí myší na kód či skupinu zobrazí vysvětlující text (u některých vyřazených není k dispozici). Čísla jsou oproti zdroji zaokrouhlena na 3 desetinná místa.

Segmentation from 97% to 100%: Is It Time for Some Linguistics? (2012)výskyt výsledku

Identifikační kódRIV/00216224:14330/12:00062085
Název v anglickém jazyceSegmentation from 97% to 100%: Is It Time for Some Linguistics?
DruhD - Článek ve sborníku
Jazykeng - angličtina
Obor - skupinaI - Informatika
OborIN - Informatika
Rok uplatnění2012
Kód důvěrnosti údajůS - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů.
Počet výskytů výsledku1
Počet tvůrců celkem1
Počet domácích tvůrců1
Výčet všech uvedených jednotlivých tvůrcůPetr Sojka (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 7883927)
Popis výsledku v anglickém jazyceMany tasks in natural language processing (NLP) require emph{segmentation} algorithms: segmentation of paragraph into sentences, segmentation of sentences into words is needed in languages like Chinese or Thai, segmentation of words into syllables (emph{hyphenation}) or into morphological parts (e.g. getting word stem for indexing), and many other tasks (e.g. tagging) could be formulated as segmentation problems. We evaluate methodology of using emph{competing patterns} for these tasks and decide on the complexity of creation of space-optimal (minimal) patterns that completely (100,%) implement the segmentation task. We formally define this task and prove that it is in the class of emph{non-polynomial} optimization problems. However, finding space-efficient competing patterns for real NLP tasks is feasible and gives efficient scalable solutions of segmentation task: segmentation is done in emph{constant} time with respect to the size of segmented dictionary.
Klíčová slova oddělená středníkemcompeting patterns; segmentation; hyphenation; NP problems; pattern generation; patgen; context-sensitive patterns; machine learning; natural language engineering; EuDML
Stránka www, na které se nachází výsledekhttp://www.fi.muni.cz/usr/sojka/papers/sojka-raslan2012.pdf

Údaje o výsledku v závislosti na druhu výsledku

Název sborníkuSixth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2012
ISBN9788026303138
ISSN-
Počet stran výsledku11
Strana od-do121-131
Název nakladateleTribun EU
Místo vydáníBrno
Místo konání akceKarlova Studánka
Datum konání akce07.12.2011
Typ akce podle státní příslušnosti účastníkůEUR - Evropská
Kód UT WoS článku podle Web of Science-

Ostatní informace o výsledku

PředkladatelMasarykova univerzita / Fakulta informatiky
DodavatelMSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT)
Rok sběru2013
SpecifikaceRIV/00216224:14330/12:00062085!RIV13-MSM-14330___
Datum poslední aktualizace výsledku09.08.2013
Kontrolní číslo43450148

Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl

Projekt podporovaný MŠMT v programu LALA09016 - Účast ČR v European Research Consortium for Informatics and Mathematics (ERCIM) (2009 - 2012)
Podpora / návaznostiSpecifický výzkum na vysokých školách, poskytovatel MŠMT