Vyhledávání ve výsledcích Hodnocení 2016

Organizace	U	S	Kód hodnocení	Skupina oborů	Body výsledku	Body upravené	Podíl VO	Body VO	Body VO upravené	H14
Masarykova univerzita / Fakulta informatiky	12	13	D	1	8	8.020	1	8	8.020	→

Výsledky hodnocení dříve prezentovala speciální podoba stránek výskytů výsledků doplněná informacemi o hodnocení daného výskytu a výsledku. To zde supluji doplněním kopií stránek z rvvi.cz/riv z 18.12.2017 o relevantní údaje z dat H16. Najetí myší na kód či skupinu zobrazí vysvětlující text (u některých vyřazených není k dispozici). Čísla jsou oproti zdroji zaokrouhlena na 3 desetinná místa.

Large Corpora for Turkic Languages and Unsupervised Morphological Analysis (2012)výskyt výsledku

Identifikační kód	RIV/00216224:14330/12:00059944
Název v anglickém jazyce	Large Corpora for Turkic Languages and Unsupervised Morphological Analysis
Druh	D - Článek ve sborníku
Jazyk	eng - angličtina
Obor - skupina	A - Společenské vědy
Obor	AI - Jazykověda
Rok uplatnění	2012
Kód důvěrnosti údajů	S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů.
Počet výskytů výsledku	1
Počet tvůrců celkem	2
Počet domácích tvůrců	2
Výčet všech uvedených jednotlivých tvůrců	Vít Baisa (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 9652353) Vít Suchomel (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 8884439)
Popis výsledku v anglickém jazyce	In this article we describe six new web corpora for Turkish, Azerbaijani, Kazakh, Turkmen, Kyrgyz and Uzbek languages. The data for these corpora was automatically crawled from the web by SpiderLing. Only minimal knowledge of these languages was requiredto obtain the data in raw form. Corpora are tokenized only since morphological analyzers and disambiguators for these languages are not available (except for Turkish). Subsequent experiment with unsupervised morphological segmentation was carried out onthe Turkish corpus. In this experiment we achieved encouraging results. We used data provided for MorphoChallenge competition for the purpose of evaluation.
Klíčová slova oddělená středníkem	corpus; turkic languages; unsupervised morphological analysis
Stránka www, na které se nachází výsledek	-

Údaje o výsledku v závislosti na druhu výsledku

Název sborníku	Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)
ISBN	9782951740877
ISSN	-
Počet stran výsledku	5
Strana od-do	28-32
Název nakladatele	European Language Resources Association (ELRA)
Místo vydání	Istanbul, Turkey
Místo konání akce	Istanbul
Datum konání akce	2012
Typ akce podle státní příslušnosti účastníků	WRD - Celosvětová
Kód UT WoS článku podle Web of Science	-

Ostatní informace o výsledku

Předkladatel	Masarykova univerzita / Fakulta informatiky
Dodavatel	MSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT)
Rok sběru	2013
Specifikace	RIV/00216224:14330/12:00059944!RIV13-MSM-14330___
Datum poslední aktualizace výsledku	09.08.2013
Kontrolní číslo	43449711

Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl

Projekt podporovaný MŠMT v programu LM	LM2010013 - LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (2010 - 2015)
Podpora / návaznosti	Specifický výzkum na vysokých školách, poskytovatel MŠMT