Organizace U  S Kód
hodnocení
Skupina
oborů
Body
výsledku
Body
upravené
Podíl VOBody VOBody VO
upravené
H14
Masarykova univerzita / Fakulta informatiky1516 D 441.26215.736141.26215.736
Výsledky hodnocení dříve prezentovala speciální podoba stránek výskytů výsledků doplněná informacemi o hodnocení daného výskytu a výsledku. To zde supluji doplněním kopií stránek z rvvi.cz/riv z 18.12.2017 o relevantní údaje z dat H16. Najetí myší na kód či skupinu zobrazí vysvětlující text (u některých vyřazených není k dispozici). Čísla jsou oproti zdroji zaokrouhlena na 3 desetinná místa.

Determining Window Size from Plagiarism Corpus for Stylometric Features (2015)výskyt výsledku

Identifikační kódRIV/00216224:14330/15:00084706
Název v anglickém jazyceDetermining Window Size from Plagiarism Corpus for Stylometric Features
DruhD - Článek ve sborníku
Jazykeng - angličtina
Obor - skupinaI - Informatika
OborIN - Informatika
Rok uplatnění2015
Kód důvěrnosti údajůS - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů.
Počet výskytů výsledku1
Počet tvůrců celkem2
Počet domácích tvůrců2
Výčet všech uvedených jednotlivých tvůrcůŠimon Suchomel (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 7837445)
Michal Brandejs (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 5800951)
Popis výsledku v anglickém jazyceThe sliding window concept is a common method for computing a profile of a document with unknown structure. This paper outlines an experiment with stylometric word-based feature in order to determine an optimal size of the sliding window. It was conducted for a vocabulary richness method called average word frequency class? using the PAN 2015 source retrieval training corpus for plagiarism detection. The paper shows the pros and cons of the stop words removal for the sliding window document profiling and discusses the utilization of the selected feature for intrinsic plagiarism detection. The experiment resulted in the recommendation of setting the sliding windows to around 100 words in length for computing the text profile using the average word frequency class stylometric feature.
Klíčová slova oddělená středníkemplagiarism; average word frequency class; stylometry; text classification; intrinsic plagiarism
Stránka www, na které se nachází výsledekhttp://link.springer.com/chapter/10.1007%2F978-3-319-24027-5_31
DOI výsledku10.1007/978-3-319-24027-5_31

Údaje o výsledku v závislosti na druhu výsledku

Název sborníkuExperimental IR Meets Multilinguality, Multimodality, and Interaction
ISBN9783319240268
ISSN0302-9743
Počet stran výsledku7
Strana od-do293-299
Název nakladateleSpringer International Publishing
Místo vydáníToulouse, France
Místo konání akceToulouse, France
Datum konání akce08.09.2015
Typ akce podle státní příslušnosti účastníkůWRD - Celosvětová
Kód UT WoS článku podle Web of Science-

Ostatní informace o výsledku

PředkladatelMasarykova univerzita / Fakulta informatiky
DodavatelMSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT)
Rok sběru2016
SpecifikaceRIV/00216224:14330/15:00084706!RIV16-MSM-14330___
Datum poslední aktualizace výsledku24.05.2016
Kontrolní číslo191636357

Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl

Projekt podporovaný MŠMT v programu LGLG13010 - Zastoupení ČR v European Research Consortium for Informatics and Mathematics (2013 - 2015)
Podpora / návaznostiInstitucionální podpora na rozvoj výzkumné organizace
Specifický výzkum na vysokých školách, poskytovatel MŠMT