Organizace U  S Kód
hodnocení
Skupina
oborů
Body
výsledku
Body
upravené
Podíl VOBody VOBody VO
upravené
H14
Masarykova univerzita / Fakulta informatiky1112 neu 100100
Výsledky hodnocení dříve prezentovala speciální podoba stránek výskytů výsledků doplněná informacemi o hodnocení daného výskytu a výsledku. To zde supluji doplněním kopií stránek z rvvi.cz/riv z 18.12.2017 o relevantní údaje z dat H16. Najetí myší na kód či skupinu zobrazí vysvětlující text (u některých vyřazených není k dispozici). Čísla jsou oproti zdroji zaokrouhlena na 3 desetinná místa.

Building a 50M Corpus of Tajik Language (2011)výskyt výsledku

Identifikační kódRIV/00216224:14330/11:00054044
Název v anglickém jazyceBuilding a 50M Corpus of Tajik Language
DruhD - Článek ve sborníku
Jazykeng - angličtina
Obor - skupinaA - Společenské vědy
OborAI - Jazykověda
Rok uplatnění2011
Kód důvěrnosti údajůS - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů.
Počet výskytů výsledku1
Počet tvůrců celkem4
Počet domácích tvůrců4
Výčet všech uvedených jednotlivých tvůrcůGulshan Dovudov (státní příslušnost: TJ - Republika Tádžikistán, domácí tvůrce: A)
Jan Pomikálek (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 4980190)
Vít Suchomel (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 8884439)
Pavel Šmerk (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 1322451)
Popis výsledku v anglickém jazycePaper presents by far the largest available computer corpus of Tajik Language of the size of more than 50 million words. To obtain the texts for the corpus two different approaches were used. The paper brings a description of both of them, discusses their advantages and disadvantages and shows some statistics of the two respective partial corpora. Then the paper characterizes the resulting joined corpus and finally discusses some possible future improvements.
Klíčová slova oddělená středníkemlanguage corpora; corpus; corpus building; tajik
Stránka www, na které se nachází výsledek-

Údaje o výsledku v závislosti na druhu výsledku

Název sborníkuProceedings of Recent Advances in Slavonic Natural Language Processing, RASLAN 2011
ISBN978-80-263-0077-9
ISSN-
Počet stran výsledku7
Strana od-do89-95
Název nakladateleTribun EU
Místo vydáníBrno
Místo konání akceKarlova Studánka
Datum konání akce2011
Typ akce podle státní příslušnosti účastníkůCST - Celostátní
Kód UT WoS článku podle Web of Science-

Ostatní informace o výsledku

PředkladatelMasarykova univerzita / Fakulta informatiky
DodavatelMSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT)
Rok sběru2012
SpecifikaceRIV/00216224:14330/11:00054044!RIV12-MSM-14330___
Datum poslední aktualizace výsledku07.05.2012
Kontrolní číslo13244028

Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl

Projekt podporovaný MŠMT v programu LCLC536 - Integrované centrum počítačového zpracování přirozeného jazyka (2005 - 2009)
Podpora / návaznostiSpecifický výzkum na vysokých školách, poskytovatel MŠMT