]> www.fi.muni.cz Git - pan12-paper.git/blob - paper.tex
Uterni psani
[pan12-paper.git] / paper.tex
1 \documentclass{llncs}
2 \usepackage[american]{babel}
3 %\usepackage[T1]{fontenc}
4 \usepackage[utf8]{inputenc}
5 \usepackage{times}
6 \usepackage{graphicx}
7 \usepackage{algorithm}
8 \usepackage{algorithmic}
9 \usepackage{amssymb}
10
11 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
12 \begin{document}
13
14 \title{Three way search engine queries with multi-feature document comparison for plagiarism detection}
15 %%% Please do not remove the subtitle.
16 \subtitle{Notebook for PAN at CLEF 2012}
17
18 \author{\v{S}imon Suchomel \and Jan Kasprzak \and Michal Brandejs}
19 \institute{Faculty of Informatics, Masaryk University \\
20 {\tt\{suchomel,kas,brandejs\}@fi.muni.cz}}
21
22 \maketitle
23
24 \begin{abstract}
25 Briefly describe the main ideas of your approach.
26 \end{abstract}
27
28
29 \section{Introduction}
30
31 %The notebooks shall contain a full write-up of your approach, including all details necessary to reproduce your results.
32
33
34 Due to the increasing ease of plagiarism the plagiarism detection has nowadays become a need for many institutions.
35 Especially for universities where modern learning methods include e-learning and a vast document sources are online available.
36 In the Information System of Masaryk University there is also an antiplagiarism tool which is based upon the same principles as are shown in this paper.
37 The core methods for automatic plagiarism detection, which also work in practice on extensive collections of documents,
38 are based on computation document similarities. In order to compute a similarity
39 we need to possess the original and the plagiarized document.
40 The most straightforward method is to use an online search engine in order to enrich
41 document base with potential plagiarized documents and evaluate the amount of plagiarism by detailed document comparison. 
42 In this paper we introduce a method which has been used in PAN 2012 competition\footnote{\url{http://pan.webis.de/}}
43 in plagiarism detection.
44 In the first section we described our aproach to retrieve candidate documents for detailed document comparison from online sources.
45  
46 The next section describes used methods of computation document similarities.
47 We also discuss the performance ...
48
49
50
51 \include{simon-searchengine}
52 \include{yenya-detailed}
53
54 \section{Conclusions}
55
56 We have presented methods for candidate document retrieval which has led to
57 discovery the decent amount of plagiarism with minimizing the number of used queries.   
58
59 We have created three main types of queries: keywords based, intrinsic plagiarism based and headers based.
60 ....
61 %We distinguish two properties of queries: positionable, conditionally executable  
62
63 ....
64 \bibliographystyle{splncs03}
65 \begin{raggedright}
66 \bibliography{paper}
67 \end{raggedright}
68
69 \end{document}
70
71
72 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
73