RIV/00216224:14330/12:00061900 - POS Annotated 50M Corpus of Tajik Language (2012)

Údaje o výsledku
Identifikační kódRIV/00216224:14330/12:00061900
Název v původním jazycePOS Annotated 50M Corpus of Tajik Language
DruhD - Článek ve sborníku
Jazykeng - angličtina
OborIN - Informatika
Rok uplatnění2012
Kód důvěrnosti údajůS - Úplné a pravdivé údaje nepodléhající ochraně podle zvláštních právních předpisů
Počet výskytů výsledku1
Údaje z Hodnocení výsledků výzkumných organizací 2014
Výsledek byl hodnocen v Pilíři I
Rozsah vyřazení výsledkuTento výskyt výsledku není vyřazen
Zařazení výsledku v hodnoceníD - Článek ve sborníku
Skupina oboru v hodnocení04 - Technické a informatické vědy
Konkrétní způsob(y) hodnocení výsledkuČlánek ve sborníku evidovaném v databázi Conference Proceedings Citation Index
Bodové ohodnocení8,000
Faktor korekce77,6 %
Body (upravené podle přílohy č. 8 Metodiky)6,205
Rozdělení výsledku mezi předkladatele
OrganizaceVýzkumná organizace?PodílBodyBody (upravené podle přílohy č. 8 Metodiky)
Masarykova univerzita / Fakulta informatikyano100,0 %8,0006,205
Tvůrci výsledku
Počet tvůrců celkem3
Počet domácích tvůrců3
TvůrceDovudov Gulshan (státní příslušnost: TJ - Republika Tádžikistán; A - domácí tvůrce)
TvůrceSuchomel Vít (státní příslušnost: CZ - Česká republika; A - domácí tvůrce; vedidk: 8884439)
TvůrceŠmerk Pavel (státní příslušnost: CZ - Česká republika; A - domácí tvůrce; G - garant výsledku; vedidk: 1322451)
Údaje blíže specifikující výsledek
Popis v původním jazycePaper presents by far the largest available computer corpus of Tajik language of the size of more than 50 million words. To obtain the texts for the corpus two different approaches were used and the paper offers a description of both of them. Then the paper describes a newly developed morphological analyzer of Tajik and presents some statistics of its application on the corpus.
Klíčová slovaTajik language; Tajik corpus; morphological analysis of Tajik
Název sborníkuProceedings of the Workshop on Language Technology for Normalisation of Less-Resourced Languages (SALTMIL 8/AfLaT 2012)
Rozsah stran93-98
Forma vydáníE - Elektronická verze „online“
ISBN9782951740877
Počet stran výsledku6
Název nakladateleEuropean Language Resources Association (ELRA)
Místo vydáníIstanbul
Místo konání akceIstanbul, Turkey
Rok konání akce2012
Typ akce podle státní příslušnoti účastníkůWRD - Světová
Adresa www stránky s výsledkemhttp://www.cnts.ua.ac.be/sites/default/files/saltmil8-aflat2012.pdf
Údaje o tomto záznamu o výsledku
PředkladatelMasarykova univerzita / Fakulta informatiky
DodavatelMSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT)
Rok sběru2013
Systémové označení dodávky datRIV13-MSM-14330___/02:2
SpecifikaceRIV/00216224:14330/12:00061900!RIV13-MSM-14330___
Kontrolní kód[7C4137A27BAE]
Jiný výskyt tohoto výsledku se v RIV nenachází
Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl
ProjektLM2010013 - LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (2010-2015, MSM/LM)