RIV/00216224:14330/11:00054037 - A Framework for Authorship Identification in the Internet Environment (2011)

Údaje o výsledku
Identifikační kódRIV/00216224:14330/11:00054037
Název v původním jazyceA Framework for Authorship Identification in the Internet Environment
DruhD - Článek ve sborníku
Jazykeng - angličtina
OborJD - Využití počítačů, robotika a její aplikace
Rok uplatnění2011
Kód důvěrnosti údajůS - Úplné a pravdivé údaje nepodléhající ochraně podle zvláštních právních předpisů
Počet výskytů výsledku2
Údaje z Hodnocení výsledků výzkumných organizací 2014
Výsledek byl hodnocen v Pilíři I
Rozsah vyřazení výsledkuTento výskyt výsledku není vyřazen
Zařazení výsledku v hodnoceníneu - Výsledky bez bodového hodnocení nebo vyřazené
Skupina oboru v hodnocení04 - Technické a informatické vědy
Konkrétní způsob(y) hodnocení výsledkuČlánek ve sborníku má uvedeno ISBN nebo ISSN, ale to není v databázi Conference Proceedings Citation Index ani v databázi Scopus.
Rozdělení výsledku mezi předkladatele
OrganizaceVýzkumná organizace?PodílBodyBody (upravené podle přílohy č. 8 Metodiky)
Masarykova univerzita / Fakulta informatikyano100,0 %0,000
Tvůrci výsledku
Počet tvůrců celkem2
Počet domácích tvůrců2
TvůrceRygl Jan (státní příslušnost: CZ - Česká republika; A - domácí tvůrce; vedidk: 6045111)
TvůrceHorák Aleš (státní příslušnost: CZ - Česká republika; A - domácí tvůrce; G - garant výsledku; vedidk: 3161870)
Údaje blíže specifikující výsledek
Popis v původním jazyceMisuse of anonymous online communication for illegal purposes has become a major concern. In this paper, we present a framework named ART (Authorship Recognition Tool), that is designed to minimize manual procedures and maximize the efficiency of authorship identification based on the content of Internet electronic documents. The framework covers the phases of document retrieval and database document management. ART provides implementations of efficient authorship identification algorithm and authorship similarity algorithm including the possibility to obtain extra data for learning and tests. The framework also determines whether or not different author’s identities are interlinked. The authorship is analysed by machine learning and natural language processing methods. Technical information such as IP address is considered only as an optional attribute for the machine learning because it can be easily forged or devalued if the author communicates from public places or through proxy servers.
Klíčová slovaauthorship identification; authorship similarity
Rozsah stran117-124
Název sborníkuProceedings of Fifth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2011
Počet stran výsledku8
ISBN978-80-263-0077-9
Název nakladateleTribun EU
Místo vydáníBrno (Czech Republic)
Místo konání akceKarlova Studánka, Czech Republic
Datum zahájení akce2.12.2011
Typ akce podle státní příslušnoti účastníkůWRD - Světová
Údaje o tomto záznamu o výsledku
PředkladatelMasarykova univerzita / Fakulta informatiky
DodavatelMSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT)
Rok sběru2012
Systémové označení dodávky datRIV12-MSM-14330___/01:1
SpecifikaceRIV/00216224:14330/11:00054037!RIV12-MSM-14330___
Kontrolní kód[F86F05C95006]
Další výskyty tohoto výsledku od stejného předkladatele
Dodáno MV v roce 2012Záznam s identifikačním kódem RIV/00216224:14330/11:00054037 v dodávce dat RIV12-MV0-14330___/01:1
Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl
ProjektLC536 - Centrum komputační lingvistiky (2005-2011, MSM/LC)
ProjektVF20102014003 - Analýza přirozeného jazyka v prostředí internetu (2010-2014, MV0/VF)
S - Specifický výzkum na vysokých školách