Organizace U  S Kód
hodnocení
Skupina
oborů
Body
výsledku
Body
upravené
Podíl VOBody VOBody VO
upravené
H14
Masarykova univerzita / Fakulta informatiky1415 D 184.515184.515
Výsledky hodnocení dříve prezentovala speciální podoba stránek výskytů výsledků doplněná informacemi o hodnocení daného výskytu a výsledku. To zde supluji doplněním kopií stránek z rvvi.cz/riv z 18.12.2017 o relevantní údaje z dat H16. Najetí myší na kód či skupinu zobrazí vysvětlující text (u některých vyřazených není k dispozici). Čísla jsou oproti zdroji zaokrouhlena na 3 desetinná místa.

Character-based Language Model (2014)výskyt výsledku

Identifikační kódRIV/00216224:14330/14:00077506
Název v anglickém jazyceCharacter-based Language Model
DruhD - Článek ve sborníku
Jazykeng - angličtina
Obor - skupinaA - Společenské vědy
OborAI - Jazykověda
Rok uplatnění2014
Kód důvěrnosti údajůS - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů.
Počet výskytů výsledku1
Počet tvůrců celkem1
Počet domácích tvůrců1
Výčet všech uvedených jednotlivých tvůrcůVít Baisa (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 9652353)
Popis výsledku v anglickém jazyceLanguage modelling and also other natural language processing tasks are usually based on words. I present here a more general yet simpler approach to language modelling using much smaller units of text data: character-based language model (CBLM). In thispaper I describe the underlying data structure of the model, evaluate the model using standard measures (entropy, perplexity). As a proof-of-concept and an extrinsic evaluation I present also a random sentence generator based on this model.
Klíčová slova oddělená středníkemlanguage model; suffix array; LCP; trie; character-based; random text generator; corpus
Stránka www, na které se nachází výsledek-

Údaje o výsledku v závislosti na druhu výsledku

Název sborníkuEighth Workshop on Recent Advances in Slavonic Natural Language Processing
ISBN-
ISSN2336-4289
Počet stran výsledku8
Strana od-do3-10
Název nakladateleTribun EU
Místo vydáníBrno
Místo konání akceBrno
Datum konání akce2014
Typ akce podle státní příslušnosti účastníkůCST - Celostátní
Kód UT WoS článku podle Web of Science-

Ostatní informace o výsledku

PředkladatelMasarykova univerzita / Fakulta informatiky
DodavatelMSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT)
Rok sběru2015
SpecifikaceRIV/00216224:14330/14:00077506!RIV15-MSM-14330___
Datum poslední aktualizace výsledku29.05.2015
Kontrolní číslo152394471

Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl

Projekt podporovaný MŠMT v programu LMLM2010013 - LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (2010 - 2015)
Podpora / návaznostiSpecifický výzkum na vysokých školách, poskytovatel MŠMT