Identifikační kód | RIV/00216224:14330/11:00054037 |
Název v anglickém jazyce | A Framework for Authorship Identification in the Internet Environment |
Druh | D - Článek ve sborníku |
Jazyk | eng - angličtina |
Obor - skupina | J - Průmysl |
Obor | JD - Využití počítačů, robotika a její aplikace |
Rok uplatnění | 2011 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů. |
Počet výskytů výsledku | 2 |
Počet tvůrců celkem | 2 |
Počet domácích tvůrců | 2 |
Výčet všech uvedených jednotlivých tvůrců | Jan Rygl (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 6045111) Aleš Horák (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 3161870) |
Popis výsledku v anglickém jazyce | Misuse of anonymous online communication for illegal purposes has become a major concern. In this paper, we present a framework named ART (Authorship Recognition Tool), that is designed to minimize manual procedures and maximize the efficiency of authorship identification based on the content of Internet electronic documents. The framework covers the phases of document retrieval and database document management. ART provides implementations of efficient authorship identification algorithm and authorshipsimilarity algorithm including the possibility to obtain extra data for learning and tests. The framework also determines whether or not different author?s identities are interlinked. The authorship is analysed by machine learning and natural language processing methods. Technical information such as IP address is considered only as an optional attribute for the machine learning because it can be easily forged or devalued if the author communicates from public places or through proxy se |
Klíčová slova oddělená středníkem | authorship identification; authorship similarity |
Stránka www, na které se nachází výsledek | - |