]> www.fi.muni.cz Git - pan13-paper.git/blobdiff - pan13-paper/simon-source_retrieval.tex
Upravy pred odeslanim
[pan13-paper.git] / pan13-paper / simon-source_retrieval.tex
index 4370a1de5ae5f1a2bedd226e9167c0c149823621..2777f3777f544a469697bf2305e6226e1fa9d287 100755 (executable)
@@ -5,7 +5,7 @@ large corpus. Those candidate documents are usually further compared in detail w
 suspicious document. In PAN 2013 source retrieval subtask the main goal was to\r
 identify web pages which have been used as a source of plagiarism for test corpus creation.\r
 \r
-The test corpus contained 58 documents each discussing only one theme.\r
+The test corpus contained 58 documents each discussing one topic only.\r
 Those documents were created intentionally by\r
  semiprofessional writers, thus they featured nearly realistic plagiarism cases~\cite{plagCorpus}.\r
 Resources were looked up in the ClueWeb\footnote{\url{http://lemurproject.org/clueweb09.php/}} corpus.\r