RIV/00216224:14330/12:00060279 - Similarity Ranking as Attribute for Machine Learning Approach to Authorship Identification (2012)

Údaje o výsledku
Identifikační kódRIV/00216224:14330/12:00060279
Název v původním jazyceSimilarity Ranking as Attribute for Machine Learning Approach to Authorship Identification
DruhD - Článek ve sborníku
Jazykeng - angličtina
OborAI - Jazykověda
Rok uplatnění2012
Kód důvěrnosti údajůS - Úplné a pravdivé údaje nepodléhající ochraně podle zvláštních právních předpisů
Počet výskytů výsledku2
Údaje z Hodnocení výsledků výzkumných organizací 2014
Výsledek byl hodnocen v Pilíři I
Rozsah vyřazení výsledkuTento výskyt výsledku není vyřazen
Zařazení výsledku v hodnoceníD - Článek ve sborníku
Skupina oboru v hodnocení01 - Společenské, humanitní a umělecké vědy - SHVa
Konkrétní způsob(y) hodnocení výsledkuČlánek ve sborníku evidovaném v databázi Conference Proceedings Citation Index
Bodové ohodnocení8,000
Faktor korekce100,3 %
Body (upravené podle přílohy č. 8 Metodiky)8,020
Rozdělení výsledku mezi předkladatele
OrganizaceVýzkumná organizace?PodílBodyBody (upravené podle přílohy č. 8 Metodiky)
Masarykova univerzita / Fakulta informatikyano100,0 %8,0008,020
Tvůrci výsledku
Počet tvůrců celkem2
Počet domácích tvůrců2
TvůrceRygl Jan (státní příslušnost: CZ - Česká republika; A - domácí tvůrce; vedidk: 6045111)
TvůrceHorák Aleš (státní příslušnost: CZ - Česká republika; A - domácí tvůrce; G - garant výsledku; vedidk: 3161870)
Údaje blíže specifikující výsledek
Popis v původním jazyceIn the authorship identification task, examples of short writings of N authors and an anonymous document written by one of these N authors are given. The task is to determine the authorship of the anonymous text. Practically all approaches solved this problem with machine learning methods. The input attributes for the machine learning process are usually formed by stylistic or grammatical properties of individual documents or a defined similarity between a document and an author. In this paper, we present the results of an experiment to extend the machine learning attributes by ranking the similarity between a document and an author: we transform the similarity between an unknown document and one of the N authors to the order in which the author is the most similar to the document in the set of N authors. The comparison of similarity probability and similarity ranking was made using the Support Vector Machines algorithm.
Klíčová slovaauthorship identification; machine learning; similarity ranking
Název sborníkuProceedings of the Eight International Conference on Language Resources and Evaluation
Forma vydáníP - Tištěná verze „print“
Počet stran výsledku4
ISBN9782951740877
Název nakladateleEuropean Language Resources Association
Místo vydáníIstanbul (Turkey)
Místo konání akceIstanbul (Turkey)
Datum zahájení akce23.5.2012
Typ akce podle státní příslušnoti účastníkůWRD - Světová
Údaje o tomto záznamu o výsledku
PředkladatelMasarykova univerzita / Fakulta informatiky
DodavatelMV0 - Ministerstvo vnitra (MV)
Rok sběru2013
Systémové označení dodávky datRIV13-MV0-14330___/01:1
SpecifikaceRIV/00216224:14330/12:00060279!RIV13-MV0-14330___
Kontrolní kód[D8249F592280]
Další výskyty tohoto výsledku od stejného předkladatele
Dodáno MŠMT v roce 2013Záznam s identifikačním kódem RIV/00216224:14330/12:00060279 v dodávce dat RIV13-MSM-14330___/02:2
Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl
ProjektVF20102014003 - Analýza přirozeného jazyka v prostředí internetu (2010-2014, MV0/VF)
S - Specifický výzkum na vysokých školách