Organizace U  S Kód
hodnocení
Skupina
oborů
Body
výsledku
Body
upravené
Podíl VOBody VOBody VO
upravené
H14
Masarykova univerzita / Fakulta informatiky1213 D 486.205186.205
Výsledky hodnocení dříve prezentovala speciální podoba stránek výskytů výsledků doplněná informacemi o hodnocení daného výskytu a výsledku. To zde supluji doplněním kopií stránek z rvvi.cz/riv z 18.12.2017 o relevantní údaje z dat H16. Najetí myší na kód či skupinu zobrazí vysvětlující text (u některých vyřazených není k dispozici). Čísla jsou oproti zdroji zaokrouhlena na 3 desetinná místa.

POS Annotated 50M Corpus of Tajik Language (2012)výskyt výsledku

Identifikační kódRIV/00216224:14330/12:00061900
Název v anglickém jazycePOS Annotated 50M Corpus of Tajik Language
DruhD - Článek ve sborníku
Jazykeng - angličtina
Obor - skupinaI - Informatika
OborIN - Informatika
Rok uplatnění2012
Kód důvěrnosti údajůS - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů.
Počet výskytů výsledku1
Počet tvůrců celkem3
Počet domácích tvůrců3
Výčet všech uvedených jednotlivých tvůrcůGulshan Dovudov (státní příslušnost: TJ - Republika Tádžikistán, domácí tvůrce: A)
Vít Suchomel (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 8884439)
Pavel Šmerk (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 1322451)
Popis výsledku v anglickém jazycePaper presents by far the largest available computer corpus of Tajik language of the size of more than 50 million words. To obtain the texts for the corpus two different approaches were used and the paper offers a description of both of them. Then the paper describes a newly developed morphological analyzer of Tajik and presents some statistics of its application on the corpus.
Klíčová slova oddělená středníkemTajik language; Tajik corpus; morphological analysis of Tajik
Stránka www, na které se nachází výsledekhttp://www.cnts.ua.ac.be/sites/default/files/saltmil8-aflat2012.pdf

Údaje o výsledku v závislosti na druhu výsledku

Název sborníkuProceedings of the Workshop on Language Technology for Normalisation of Less-Resourced Languages (SALTMIL 8/AfLaT 2012)
ISBN9782951740877
ISSN-
Počet stran výsledku6
Strana od-do93-98
Název nakladateleEuropean Language Resources Association (ELRA)
Místo vydáníIstanbul
Místo konání akceIstanbul, Turkey
Datum konání akce2012
Typ akce podle státní příslušnosti účastníkůWRD - Celosvětová
Kód UT WoS článku podle Web of Science-

Ostatní informace o výsledku

PředkladatelMasarykova univerzita / Fakulta informatiky
DodavatelMSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT)
Rok sběru2013
SpecifikaceRIV/00216224:14330/12:00061900!RIV13-MSM-14330___
Datum poslední aktualizace výsledku09.08.2013
Kontrolní číslo43450093

Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl

Projekt podporovaný MŠMT v programu LMLM2010013 - LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (2010 - 2015)