RIV/00216224:14330/12:00060281 - Authorship Attribution: Comparison of Single-layer and Double-layer Machine Learning (2012)

Údaje o výsledku
Identifikační kódRIV/00216224:14330/12:00060281
Název v původním jazyceAuthorship Attribution: Comparison of Single-layer and Double-layer Machine Learning
DruhD - Článek ve sborníku
Jazykeng - angličtina
OborAI - Jazykověda
Rok uplatnění2012
Kód důvěrnosti údajůS - Úplné a pravdivé údaje nepodléhající ochraně podle zvláštních právních předpisů
Počet výskytů výsledku2
Údaje z Hodnocení výsledků výzkumných organizací 2014
Výsledek byl hodnocen v Pilíři I
Rozsah vyřazení výsledkuTento výskyt výsledku není vyřazen
Zařazení výsledku v hodnoceníD - Článek ve sborníku
Skupina oboru v hodnocení01 - Společenské, humanitní a umělecké vědy - SHVa
Konkrétní způsob(y) hodnocení výsledkuVýsledek hodnocený již v předchozím hodnocení, body se přebírají
Bodové ohodnocení44,376
Faktor korekce100,3 %
Body (upravené podle přílohy č. 8 Metodiky)44,487
Rozdělení výsledku mezi předkladatele
OrganizaceVýzkumná organizace?PodílBodyBody (upravené podle přílohy č. 8 Metodiky)
Masarykova univerzita / Fakulta informatikyano100,0 %44,37644,487
Tvůrci výsledku
Počet tvůrců celkem2
Počet domácích tvůrců2
TvůrceRygl Jan (státní příslušnost: CZ - Česká republika; A - domácí tvůrce; vedidk: 6045111)
TvůrceHorák Aleš (státní příslušnost: CZ - Česká republika; A - domácí tvůrce; G - garant výsledku; vedidk: 3161870)
Údaje blíže specifikující výsledek
Popis v původním jazyceIn the traditional authorship attribution task, forensic linguistic specialists analyse and compare documents to determine who was their (real) author. In the current days, the number of anonymous docu- ments is growing ceaselessly because of Internet expansion. That is why the manual part of the authorship attribution process needs to be replaced with automatic methods. Specialized algorithms (SA) like delta-score and word length statistic were developed to quantify the similarity between documents, but currently prevailing techniques build upon the machine learning (ML) approach. In this paper, two machine learning approaches are compared: Single-layer ML, where the results of SA (similarities of documents) are used as input attributes for the machine learning, and Double-layer ML with the numerical information characterizing the author being extracted from documents and divided into several groups.
Klíčová slovadouble layered machine learning; authorship attribution; similarity of documents
Rozsah stran282-289
Název sborníkuText, Speech and Dialogue - 15th International Conference
Forma vydáníP - Tištěná verze „print“
ISSN0302-9743
Počet stran výsledku8
ISBN9783642327896
Název nakladateleSpringer-Verlag
Místo vydáníBrno
Místo konání akceBrno, Czech Republic
Datum zahájení akce3.9.2012
Typ akce podle státní příslušnoti účastníkůWRD - Světová
DOI výsledku10.1007/978-3-642-32790-2_34
Údaje o tomto záznamu o výsledku
PředkladatelMasarykova univerzita / Fakulta informatiky
DodavatelMV0 - Ministerstvo vnitra (MV)
Rok sběru2013
Systémové označení dodávky datRIV13-MV0-14330___/01:1
SpecifikaceRIV/00216224:14330/12:00060281!RIV13-MV0-14330___
Kontrolní kód[F3A4CE08810E]
Další výskyty tohoto výsledku od stejného předkladatele
Dodáno MŠMT v roce 2013Záznam s identifikačním kódem RIV/00216224:14330/12:00060281 v dodávce dat RIV13-MSM-14330___/02:2
Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl
ProjektVF20102014003 - Analýza přirozeného jazyka v prostředí internetu (2010-2014, MV0/VF)
S - Specifický výzkum na vysokých školách