Identifikační kód | RIV/00216224:14330/11:00053335 |
Název v anglickém jazyce | The Art of Mathematics Retrieval |
Druh | D - Článek ve sborníku |
Jazyk | eng - angličtina |
Obor - skupina | I - Informatika |
Obor | IN - Informatika |
Rok uplatnění | 2011 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů. |
Počet výskytů výsledku | 1 |
Počet tvůrců celkem | 2 |
Počet domácích tvůrců | 2 |
Výčet všech uvedených jednotlivých tvůrců | Petr Sojka (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 7883927) Martin Líška (státní příslušnost: SK - Slovenská republika, domácí tvůrce: A, vedidk: 4357469) |
Popis výsledku v anglickém jazyce | The design and architecture of MIaS (Math Indexer and Searcher), a system for mathematics retrieval is presented, and design decisions are discussed. We argue for an approach based on Presentation MathML using a similarity of math subformulae. The systemwas implemented as a math-aware search engine based on the state-of-the-art system Apache Lucene. Scalability issues were checked against more than 400,000 arXiv documents with 158 million mathematical formulae. Almost three billion MathML subformulae were indexed using a Solr-compatible Lucene. |
Klíčová slova oddělená středníkem | math indexing and retrieval; mathematical digital libraries; information systems; information retrieval; mathematical content search; document ranking of mathematical papers; math text mining; MIaS; WebMIaS |
Stránka www, na které se nachází výsledek | - |
DOI výsledku | 10.1145/2034691.2034703 |