RIV/00216224:14330/13:00070316 - Intrinsic Methods for Comparison of Corpora (2013)

Údaje o výsledku
Identifikační kódRIV/00216224:14330/13:00070316
Název v původním jazyceIntrinsic Methods for Comparison of Corpora
DruhD - Článek ve sborníku
Jazykeng - angličtina
OborIN - Informatika
Rok uplatnění2013
Kód důvěrnosti údajůS - Úplné a pravdivé údaje nepodléhající ochraně podle zvláštních právních předpisů
Počet výskytů výsledku1
Údaje z Hodnocení výsledků výzkumných organizací 2014
Výsledek byl hodnocen v Pilíři I
Rozsah vyřazení výsledkuTento výskyt výsledku není vyřazen
Zařazení výsledku v hodnoceníneu - Výsledky bez bodového hodnocení nebo vyřazené
Skupina oboru v hodnocení04 - Technické a informatické vědy
Konkrétní způsob(y) hodnocení výsledkuČlánek ve sborníku má uvedeno ISBN nebo ISSN, ale to není v databázi Conference Proceedings Citation Index ani v databázi Scopus.
Rozdělení výsledku mezi předkladatele
OrganizaceVýzkumná organizace?PodílBodyBody (upravené podle přílohy č. 8 Metodiky)
Masarykova univerzita / Fakulta informatikyano100,0 %0,000
Tvůrci výsledku
Počet tvůrců celkem2
Počet domácích tvůrců2
TvůrceBaisa Vít (státní příslušnost: CZ - Česká republika; A - domácí tvůrce; vedidk: 9652353)
TvůrceSuchomel Vít (státní příslušnost: CZ - Česká republika; A - domácí tvůrce; vedidk: 8884439)
Údaje blíže specifikující výsledek
Popis v původním jazyceSince there are only very few techniques for quantitative and systematic comparison of text corpora we proposed and implemented several novel methods. The procedures were applied to comparing two very large web based Czech text corpora: czTenTen12 and Hector with more than 4.47 and 2.65 billion words, respectively. All methods are fully automatic and some of them are even language independent. We released some of them so they can be used instantly for comparison of other corpora.
Klíčová slovatext corpus; corpora comparison
Rozsah stran51-58
Název sborníkuRASLAN 2013 Recent Advances in Slavonic Natural Language Processing
Forma vydáníP - Tištěná verze „print“
ISBN9788026305200
Počet stran výsledku8
Název nakladateleTribun EU
Místo vydáníBrno
Místo konání akceKarlova studánka, Česká republika
Datum zahájení akce6.12.2013
Typ akce podle státní příslušnoti účastníkůEUR - Evropská
Údaje o tomto záznamu o výsledku
PředkladatelMasarykova univerzita / Fakulta informatiky
DodavatelMSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT)
Rok sběru2014
Systémové označení dodávky datRIV14-MSM-14330___/01:1
SpecifikaceRIV/00216224:14330/13:00070316!RIV14-MSM-14330___
Kontrolní kód[AC486683F094]
Jiný výskyt tohoto výsledku se v RIV nenachází
Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl
ProjektLM2010013 - LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (2010-2015, MSM/LM)
S - Specifický výzkum na vysokých školách