]> www.fi.muni.cz Git - pan12-paper.git/blobdiff - paper.tex
Pondelni psani.
[pan12-paper.git] / paper.tex
old mode 100644 (file)
new mode 100755 (executable)
index 27db7db..92e4a39
--- a/paper.tex
+++ b/paper.tex
@@ -8,7 +8,7 @@
 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
 \begin{document}
 
-\title{Your Title}
+\title{Three way search engine queries with multi-feature document comparison for plagiarism detection}
 %%% Please do not remove the subtitle.
 \subtitle{Notebook for PAN at CLEF 2012}
 
@@ -25,7 +25,24 @@ Briefly describe the main ideas of your approach.
 
 \section{Introduction}
 
-The notebooks shall contain a full write-up of your approach, including all details necessary to reproduce your results.
+%The notebooks shall contain a full write-up of your approach, including all details necessary to reproduce your results.
+
+
+Due to the increasing ease of plagiarism the plagiarism detection has nowadays become a need for many institutions.
+Especially for universities where modern learning methods include e-learning and a vast document sources are online available.
+In the Information System of Masaryk University there is also an antiplagiarism tool which is based upon the same principles as are shown in this paper.
+The core methods for automatic plagiarism detection, which also work in practice on extensive collections of documents,
+are based on computation document similarities. In order to compute a similarity
+we need to possess the original and the plagiarized document.
+The most straightforward method is to use an online search engine in order to enrich
+document base with potential plagiarized documents and evaluate the amount of plagiarism by detailed document comparison. 
+In this paper we introduce a method which has been used in PAN 2012 competition\footnote{\url{http://pan.webis.de/}}
+in plagiarism detection.
+In the first section we described our aproach to retrieve candidate documents for detailed document comparison from online sources.
+The next section describes used methods of computation document similarities.
+We also discuss the performance ...
+
 
 
 \include{simon-searchengine}
@@ -33,8 +50,14 @@ The notebooks shall contain a full write-up of your approach, including all deta
 
 \section{Conclusions}
 
-Tady napsat zaver
+We have presented methods for candidate document retrieval which has led to
+discovery the decent amount of plagiarism with minimizing the number of used queries.   
+
+We have created three main types of queries: keywords based, intrinsic plagiarism based and headers based.
+....
+%We distinguish two properties of queries: positionable, conditionally executable  
 
+....
 \bibliographystyle{splncs03}
 \begin{raggedright}
 \bibliography{paper}