Údaje o výsledku |
Identifikační kód | RIV/00216224:14330/12:00061900 |
Název v původním jazyce | POS Annotated 50M Corpus of Tajik Language |
Druh | D - Článek ve sborníku |
Jazyk | eng - angličtina |
Obor | IN - Informatika |
Rok uplatnění | 2012 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje nepodléhající ochraně podle zvláštních právních předpisů |
Počet výskytů výsledku | 1 |
Údaje z Hodnocení výsledků výzkumných organizací 2014 |
Výsledek byl hodnocen v Pilíři I |
Rozsah vyřazení výsledku | Tento výskyt výsledku není vyřazen |
Zařazení výsledku v hodnocení | D - Článek ve sborníku |
Skupina oboru v hodnocení | 04 - Technické a informatické vědy |
Konkrétní způsob(y) hodnocení výsledku | Článek ve sborníku evidovaném v databázi Conference Proceedings Citation Index |
Bodové ohodnocení | 8,000 |
Faktor korekce | 77,6 % |
Body (upravené podle přílohy č. 8 Metodiky) | 6,205 |
Rozdělení výsledku mezi předkladatele |
Organizace | Výzkumná organizace? | Podíl | Body | Body (upravené podle přílohy č. 8 Metodiky) |
Masarykova univerzita / Fakulta informatiky | ano | 100,0 % | 8,000 | 6,205 |
|
Tvůrci výsledku |
Počet tvůrců celkem | 3 |
Počet domácích tvůrců | 3 |
Tvůrce | Dovudov Gulshan (státní příslušnost: TJ - Republika Tádžikistán; A - domácí tvůrce) |
Tvůrce | Suchomel Vít (státní příslušnost: CZ - Česká republika; A - domácí tvůrce; vedidk: 8884439) |
Tvůrce | Šmerk Pavel (státní příslušnost: CZ - Česká republika; A - domácí tvůrce; G - garant výsledku; vedidk: 1322451) |
Údaje blíže specifikující výsledek |
Popis v původním jazyce | Paper presents by far the largest available computer corpus of Tajik language of the size of more than 50 million words. To obtain the texts for the corpus two different approaches were used and the paper offers a description of both of them. Then the paper describes a newly developed morphological analyzer of Tajik and presents some statistics of its application on the corpus. |
Klíčová slova | Tajik language; Tajik corpus; morphological analysis of Tajik |
Název sborníku | Proceedings of the Workshop on Language Technology for Normalisation of Less-Resourced Languages (SALTMIL 8/AfLaT 2012) |
Rozsah stran | 93-98 |
Forma vydání | E - Elektronická verze „online“ |
ISBN | 9782951740877 |
Počet stran výsledku | 6 |
Název nakladatele | European Language Resources Association (ELRA) |
Místo vydání | Istanbul |
Místo konání akce | Istanbul, Turkey |
Rok konání akce | 2012 |
Typ akce podle státní příslušnoti účastníků | WRD - Světová |
Adresa www stránky s výsledkem | http://www.cnts.ua.ac.be/sites/default/files/saltmil8-aflat2012.pdf |
Údaje o tomto záznamu o výsledku |
Předkladatel | Masarykova univerzita / Fakulta informatiky |
Dodavatel | MSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT) |
Rok sběru | 2013 |
Systémové označení dodávky dat | RIV13-MSM-14330___/02:2 |
Specifikace | RIV/00216224:14330/12:00061900!RIV13-MSM-14330___ |
Kontrolní kód | [7C4137A27BAE] |
Jiný výskyt tohoto výsledku se v RIV nenachází |
Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl |
Projekt | LM2010013 - LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (2010-2015, MSM/LM) |