Organizace U  S Kód
hodnocení
Skupina
oborů
Body
výsledku
Body
upravené
Podíl VOBody VOBody VO
upravené
H14
Masarykova univerzita / Fakulta informatiky1415 Jsc 4107.9440.3333.3332.648
Výsledky hodnocení dříve prezentovala speciální podoba stránek výskytů výsledků doplněná informacemi o hodnocení daného výskytu a výsledku. To zde supluji doplněním kopií stránek z rvvi.cz/riv z 18.12.2017 o relevantní údaje z dat H16. Najetí myší na kód či skupinu zobrazí vysvětlující text (u některých vyřazených není k dispozici). Čísla jsou oproti zdroji zaokrouhlena na 3 desetinná místa.

arTenTen: Arabic Corpus and Word Sketches (2014)výskyt výsledku

Identifikační kódRIV/00216224:14330/14:00073241
Název v anglickém jazycearTenTen: Arabic Corpus and Word Sketches
DruhJ - Článek v odborném periodiku
Jazykeng - angličtina
Obor - skupinaI - Informatika
OborIN - Informatika
Rok uplatnění2014
Kód důvěrnosti údajůS - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů.
Počet výskytů výsledku2
Počet tvůrců celkem5
Počet domácích tvůrců1
Výčet všech uvedených jednotlivých tvůrcůTressy Arts (státní příslušnost: GB - Spojené království Velké Británie a Severního Irska)
Yonatan Belinkov (státní příslušnost: IL - Stát Izrael)
Nizar Habash (státní příslušnost: AE - Spojené arabské emiráty)
Adam Kilgarriff (státní příslušnost: GB - Spojené království Velké Británie a Severního Irska)
Vít Suchomel (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 8884439)
Popis výsledku v anglickém jazyceWe present arTenTen, a web-crawled corpus of Arabic, gathered in 2012. arTenTen consists of 5.8-billion words. A chunk of it has been lemmatized and part-of-speech (POS) tagged with the MADA tool and subsequently loaded into Sketch Engine, a leading corpus query tool, where it is open for all to use. We have also created ´word sketches?: one-page, automatic, corpus-derived summaries of a word?s grammatical and collocational behavior. We use examples to demonstrate what the corpus can show us regarding Arabic words and phrases and how this can support lexicography and inform linguistic research. The article also presents the ´sketch grammar? (the basis for the word sketches) in detail, describes the process of building and processing the corpus, and considers the role of the corpus in additional research on Arabic.
Klíčová slova oddělená středníkemCorpora; Lexicography; Morphology; Concordance; Arabic
Stránka www, na které se nachází výsledekhttp://www.sciencedirect.com/science/article/pii/S1319157814000330
DOI výsledku10.1016/j.jksuci.2014.06.009

Údaje o výsledku v závislosti na druhu výsledku

Název periodikaJournal of King Saud University-Computer and Information Sciences
ISSN1319-1578
Svazek periodika2014
Číslo periodika v rámci uvedeného svazku26
Stát vydavatele periodikaNL - Nizozemsko
Počet stran výsledku15
Strana od-do381-395
Kód UT WoS článku podle Web of Science-
EID výsledku v databázi Scopus-

Ostatní informace o výsledku

PředkladatelMasarykova univerzita / Fakulta informatiky
DodavatelMSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT)
Rok sběru2015
SpecifikaceRIV/00216224:14330/14:00073241!RIV15-MSM-14330___
Datum poslední aktualizace výsledku29.05.2015
Kontrolní číslo152394426

Informace o dalších výskytech výsledku dodaného stejným předkladatelem

Dodáno MV v roce 2015RIV/00216224:14330/14:00073241 v dodávce dat RIV15-MV0-14330___/01:1

Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl

Projekt podporovaný MŠMT v programu LMLM2010013 - LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (2010 - 2015)
Projekt podporovaný MV v programu VFVF20102014003 - Analýza přirozeného jazyka v prostředí internetu (2010 - 2014)