Organizace U  S Kód
hodnocení
Skupina
oborů
Body
výsledku
Body
upravené
Podíl VOBody VOBody VO
upravené
H14
Masarykova univerzita / Fakulta informatiky1415 D 482.984182.984
Výsledky hodnocení dříve prezentovala speciální podoba stránek výskytů výsledků doplněná informacemi o hodnocení daného výskytu a výsledku. To zde supluji doplněním kopií stránek z rvvi.cz/riv z 18.12.2017 o relevantní údaje z dat H16. Najetí myší na kód či skupinu zobrazí vysvětlující text (u některých vyřazených není k dispozici). Čísla jsou oproti zdroji zaokrouhlena na 3 desetinná místa.

Style Markers Based on Stop-word List (2014)výskyt výsledku

Identifikační kódRIV/00216224:14330/14:00077516
Název v anglickém jazyceStyle Markers Based on Stop-word List
DruhD - Článek ve sborníku
Jazykeng - angličtina
Obor - skupinaI - Informatika
OborIN - Informatika
Rok uplatnění2014
Kód důvěrnosti údajůS - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů.
Počet výskytů výsledku1
Počet tvůrců celkem2
Počet domácích tvůrců2
Výčet všech uvedených jednotlivých tvůrcůJan Rygl (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 6045111)
Marek Medveď (státní příslušnost: SK - Slovenská republika, domácí tvůrce: A, vedidk: 8900167)
Popis výsledku v anglickém jazyceThe analysis of author?s characteristic writing style and vocabulary has been used to uncover the identity of authors of documents by both manual linguistic approaches and automatic algorithmic methods. The revealing of the gender, name, or age can helpto expose pedophiles in social networks, false product reviews on the Internet servers, or machine translations submitted as manually translated texts. These problems are predominantly solved by a combination of stylometry and machine learning techniques. Since the stylometry focuses on the author?s style, word n-grams cannot be used as a style marker. Stop words are not influenced by a topic of documents, therefore they can be used to create style markers. In this paper, we present a guidance on how toimplement stop-word extraction and to include stop-words based style markers into a multilingual classification system based on the stylometry.
Klíčová slova oddělená středníkemstyle marker; stop-word list; corpus
Stránka www, na které se nachází výsledek-

Údaje o výsledku v závislosti na druhu výsledku

Název sborníkuEighth Workshop on Recent Advances in Slavonic Natural Language Processing
ISBN-
ISSN2336-4289
Počet stran výsledku5
Strana od-do85-89
Název nakladateleTribun EU
Místo vydáníBrno
Místo konání akceBrno
Datum konání akce2014
Typ akce podle státní příslušnosti účastníkůCST - Celostátní
Kód UT WoS článku podle Web of Science-

Ostatní informace o výsledku

PředkladatelMasarykova univerzita / Fakulta informatiky
DodavatelMSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT)
Rok sběru2015
SpecifikaceRIV/00216224:14330/14:00077516!RIV15-MSM-14330___
Datum poslední aktualizace výsledku29.05.2015
Kontrolní číslo152394676

Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl

Projekt podporovaný MŠMT v programu LMLM2010013 - LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (2010 - 2015)
Podpora / návaznostiSpecifický výzkum na vysokých školách, poskytovatel MŠMT