Organizace U  S Kód
hodnocení
Skupina
oborů
Body
výsledku
Body
upravené
Podíl VOBody VOBody VO
upravené
H14
Masarykova univerzita / Fakulta informatiky1314 neu 400100
Výsledky hodnocení dříve prezentovala speciální podoba stránek výskytů výsledků doplněná informacemi o hodnocení daného výskytu a výsledku. To zde supluji doplněním kopií stránek z rvvi.cz/riv z 18.12.2017 o relevantní údaje z dat H16. Najetí myší na kód či skupinu zobrazí vysvětlující text (u některých vyřazených není k dispozici). Čísla jsou oproti zdroji zaokrouhlena na 3 desetinná místa.

Fast Construction of a Word-Number Index for Large Data (2013)výskyt výsledku

Identifikační kódRIV/00216224:14330/13:00070327
Název v anglickém jazyceFast Construction of a Word-Number Index for Large Data
DruhD - Článek ve sborníku
Jazykeng - angličtina
Obor - skupinaI - Informatika
OborIN - Informatika
Rok uplatnění2013
Kód důvěrnosti údajůS - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů.
Počet výskytů výsledku1
Počet tvůrců celkem3
Počet domácích tvůrců3
Výčet všech uvedených jednotlivých tvůrcůMiloš Jakubíček (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 5837189)
Pavel Šmerk (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 1322451)
Pavel Rychlý (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 6616844)
Popis výsledku v anglickém jazyceThe paper presents a work still in progress, but with promising results. We offer a new method of construction of word to number and number to word indices for very large corpus data (tens of billions of tokens), which is up to an order of magnitude faster than the current approach. We use HAT-trie for sorting the data and Daciuk?s algorithm for building a minimal deterministic finite state automaton from sorted data. The latter we reimplemented and our new implementation is roughly three times faster and with smaller memory footprint than the one of Daciuk. This is useful not only for building word-number indices, but also for many other applications, e.g. building data for morphological analysers.
Klíčová slova oddělená středníkemword to number index; number to word index; finite state automata; hat-trie
Stránka www, na které se nachází výsledek-

Údaje o výsledku v závislosti na druhu výsledku

Název sborníkuRASLAN 2013 Recent Advances in Slavonic Natural Language Processing
ISBN9788026305200
ISSN-
Počet stran výsledku5
Strana od-do63-67
Název nakladateleTribun EU
Místo vydáníBrno
Místo konání akceBrno
Datum konání akce2013
Typ akce podle státní příslušnosti účastníkůCST - Celostátní
Kód UT WoS článku podle Web of Science-

Ostatní informace o výsledku

PředkladatelMasarykova univerzita / Fakulta informatiky
DodavatelMSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT)
Rok sběru2014
SpecifikaceRIV/00216224:14330/13:00070327!RIV14-MSM-14330___
Datum poslední aktualizace výsledku29.05.2014
Kontrolní číslo56538975

Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl

Projekt podporovaný MŠMT v programu LMLM2010013 - LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (2010 - 2015)
Podpora / návaznostiSpecifický výzkum na vysokých školách, poskytovatel MŠMT