Identifikační kód | RIV/00216224:14330/12:00067468 |
Název v anglickém jazyce | Exploiting Semantic Annotations in Math Information Retrieval |
Druh | D - Článek ve sborníku |
Jazyk | eng - angličtina |
Obor - skupina | I - Informatika |
Obor | IN - Informatika |
Rok uplatnění | 2012 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů. |
Počet výskytů výsledku | 1 |
Počet tvůrců celkem | 1 |
Počet domácích tvůrců | 1 |
Výčet všech uvedených jednotlivých tvůrců | Petr Sojka (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 7883927) |
Popis výsledku v anglickém jazyce | This paper describes exploitation of semantic annotations in the design and architecture of MIaS (Math Indexer and Searcher) system for mathematics retrieval. Basing on the claim that navigational and research search are `killer' applications for digitallibrary such as the European Digital Mathematics Library, EuDML, we argue for an approach based on Natural Language Processing techniques as used in corpus management systems such as the Sketch Engine, that will reach web scalability and avoid inferenceproblems. The main ideas are 1) to augment surface texts (including math formulae) with additional linked representations (maps) bearing semantic information (expanded formulae as text, canonicalized text and subformulae) for indexing, including supportfor indexing structural information (expressed as Content MathML or other tree structures) and 2) use semantic user preferences to order found documents. |
Klíčová slova oddělená středníkem | MIaS; MathML; indexing; search; canonical MathML; EuDML; digital libraries; information systems; information retrieval; mathematical content search; math indexing and retrieval; document ranking of math papers; text mining; DML-CZ; DML projects; semantics |
Stránka www, na které se nachází výsledek | http://dx.doi.org/10.1145/2390148.2390157 |
DOI výsledku | 10.1145/2390148.2390157 |