Vyhledávání ve výsledcích Hodnocení 2016

Organizace	U	S	Kód hodnocení	Skupina oborů	Body výsledku	Body upravené	Podíl VO	Body VO	Body VO upravené	H14
Masarykova univerzita / Fakulta informatiky	11	14	neu	1	0	0	1	0	0	→

Výsledky hodnocení dříve prezentovala speciální podoba stránek výskytů výsledků doplněná informacemi o hodnocení daného výskytu a výsledku. To zde supluji doplněním kopií stránek z rvvi.cz/riv z 18.12.2017 o relevantní údaje z dat H16. Najetí myší na kód či skupinu zobrazí vysvětlující text (u některých vyřazených není k dispozici). Čísla jsou oproti zdroji zaokrouhlena na 3 desetinná místa.

Words? Burstiness in Language Models (2011)výskyt výsledku

Identifikační kód	RIV/00216224:14330/11:00067069
Název v anglickém jazyce	Words? Burstiness in Language Models
Druh	D - Článek ve sborníku
Jazyk	eng - angličtina
Obor - skupina	A - Společenské vědy
Obor	AI - Jazykověda
Rok uplatnění	2011
Kód důvěrnosti údajů	S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů.
Počet výskytů výsledku	1
Počet tvůrců celkem	1
Počet domácích tvůrců	1
Výčet všech uvedených jednotlivých tvůrců	Pavel Rychlý (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 6616844)
Popis výsledku v anglickém jazyce	Good estimation of the probability of a single word is a crucial part of language modelling. It is based on raw frequency of the word in a training corpus. Such computation is a good estimation for functional words and most very frequent words, but it isa poor estimation for most content words because of words' tendency to occur in clusters. This paper provides an analysis of words' burstiness and propose a new unigram language model which handles bursty words much better. The evaluation of the model on two data sets shows consistently lower perplexity and cross-entropy in the new model.
Klíčová slova oddělená středníkem	Burstiness; Language models; Words' probability
Stránka www, na které se nachází výsledek	-

Údaje o výsledku v závislosti na druhu výsledku

Název sborníku	Proceedings of Recent Advances in Slavonic Natural Language Processing, RASLAN 2011
ISBN	9788026300779
ISSN	-
Počet stran výsledku	7
Strana od-do	131-137
Název nakladatele	Tribun EU
Místo vydání	Brno
Místo konání akce	Karlova Studánka
Datum konání akce	02.12.2011
Typ akce podle státní příslušnosti účastníků	EUR - Evropská
Kód UT WoS článku podle Web of Science	-

Ostatní informace o výsledku

Předkladatel	Masarykova univerzita / Fakulta informatiky
Dodavatel	GA0 - Grantová agentura České republiky (GA ČR)
Rok sběru	2014
Specifikace	RIV/00216224:14330/11:00067069!RIV14-GA0-14330___
Datum poslední aktualizace výsledku	27.05.2014
Kontrolní číslo	56677096

Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl

Projekt podporovaný GA ČR v programu GA	GA407/07/0679 - Právní e-slovník - PES (2007 - 2011)
Projekt podporovaný GA ČR v programu GA	GAP401/10/0792 - Temporální aspekty znalostí a informací (2010 - 2012)