]> www.fi.muni.cz Git - pan13-paper.git/blob - pan13-paper/pan13-notebook.tex
Abstract, Intro a trochu zkraceni
[pan13-paper.git] / pan13-paper / pan13-notebook.tex
1 \documentclass{llncs}
2 \usepackage[american]{babel}
3 \usepackage[T1]{fontenc}
4 \usepackage{times}
5 \usepackage{graphicx}
6
7 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
8 \begin{document}
9
10 \title{Improving plagiarism detection}
11 %%% Please do not remove the subtitle.
12 \subtitle{Notebook for PAN at CLEF 2013}
13
14 \author{\v{S}imon Suchomel \and Jan Kasprzak \and Michal Brandejs}
15 \institute{Faculty of Informatics, Masaryk University \\
16 {\tt\{suchomel,kas,brandejs\}@fi.muni.cz}}
17
18 \maketitle
19
20 \begin{abstract}
21 This paper describes approaches used for the Plagiarism Detection task in PAN 2013 international competition
22 on uncovering plagiarism, authorship, and social software misuse.  
23 We present modified three-way search methodology for Source Retrieval subtask and analyse snippet similarity performance.
24 Next, we show changes in selected feature for text alignement which led to plagdet score improvement.
25 The results of source retrieval show, that presented approach is adaptable in real-world plagiarism situations.
26 Improved results for text alignment achieved in the competition overall third place.
27 \end{abstract}
28
29
30 \section{Introduction}
31 In PAN 2013 competition on plagiarism detection we participated in both the Source Retrieval
32 and the Text Alignment subtask. In both tasks we adapted methodology used in PAN 2012.
33 Section~\ref{source_retr} describes querying approach for source retrieval, where we used three different 
34 types of queries. We present a new type of query based on text paragraphs.
35 The query execution were controled by its type and by preliminary similarities
36 discovered during the searches. 
37 In section~\ref{text_alignment} we present modified common text feature fot text alignment.
38 We also compare performance of both the previous and the modified algorithms. 
39
40
41 \input{simon-source_retrieval}
42 \input{yenya-text_alignment}
43
44
45 \section{Conclusions}
46
47 Unfortunately the ChatNoir search engine does not support phrasal search, therefore it
48 is possible that evaluated results may be quite distorted in this manner.
49
50 \bibliographystyle{splncs03}
51 \begin{raggedright}
52 \bibliography{pan13-notebook}
53 \end{raggedright}
54
55 \end{document}
56
57
58 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
59