Organizace U  S Kód
hodnocení
Skupina
oborů
Body
výsledku
Body
upravené
Podíl VOBody VOBody VO
upravené
H14
Masarykova univerzita / Fakulta informatiky1114 neu 100100
Výsledky hodnocení dříve prezentovala speciální podoba stránek výskytů výsledků doplněná informacemi o hodnocení daného výskytu a výsledku. To zde supluji doplněním kopií stránek z rvvi.cz/riv z 18.12.2017 o relevantní údaje z dat H16. Najetí myší na kód či skupinu zobrazí vysvětlující text (u některých vyřazených není k dispozici). Čísla jsou oproti zdroji zaokrouhlena na 3 desetinná místa.

Words? Burstiness in Language Models (2011)výskyt výsledku

Identifikační kódRIV/00216224:14330/11:00067069
Název v anglickém jazyceWords? Burstiness in Language Models
DruhD - Článek ve sborníku
Jazykeng - angličtina
Obor - skupinaA - Společenské vědy
OborAI - Jazykověda
Rok uplatnění2011
Kód důvěrnosti údajůS - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů.
Počet výskytů výsledku1
Počet tvůrců celkem1
Počet domácích tvůrců1
Výčet všech uvedených jednotlivých tvůrcůPavel Rychlý (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 6616844)
Popis výsledku v anglickém jazyceGood estimation of the probability of a single word is a crucial part of language modelling. It is based on raw frequency of the word in a training corpus. Such computation is a good estimation for functional words and most very frequent words, but it isa poor estimation for most content words because of words' tendency to occur in clusters. This paper provides an analysis of words' burstiness and propose a new unigram language model which handles bursty words much better. The evaluation of the model on two data sets shows consistently lower perplexity and cross-entropy in the new model.
Klíčová slova oddělená středníkemBurstiness; Language models; Words' probability
Stránka www, na které se nachází výsledek-

Údaje o výsledku v závislosti na druhu výsledku

Název sborníkuProceedings of Recent Advances in Slavonic Natural Language Processing, RASLAN 2011
ISBN9788026300779
ISSN-
Počet stran výsledku7
Strana od-do131-137
Název nakladateleTribun EU
Místo vydáníBrno
Místo konání akceKarlova Studánka
Datum konání akce02.12.2011
Typ akce podle státní příslušnosti účastníkůEUR - Evropská
Kód UT WoS článku podle Web of Science-

Ostatní informace o výsledku

PředkladatelMasarykova univerzita / Fakulta informatiky
DodavatelGA0 - Grantová agentura České republiky (GA ČR)
Rok sběru2014
SpecifikaceRIV/00216224:14330/11:00067069!RIV14-GA0-14330___
Datum poslední aktualizace výsledku27.05.2014
Kontrolní číslo56677096

Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl

Projekt podporovaný GA ČR v programu GAGA407/07/0679 - Právní e-slovník - PES (2007 - 2011)
Projekt podporovaný GA ČR v programu GAGAP401/10/0792 - Temporální aspekty znalostí a informací (2010 - 2012)