Identifikační kód | RIV/00216224:14330/14:00077458 |
Název v anglickém jazyce | An Architecture for Scientific Document Retrieval Using Textual and Math Entailment Modules |
Druh | D - Článek ve sborníku |
Jazyk | eng - angličtina |
Obor - skupina | I - Informatika |
Obor | IN - Informatika |
Rok uplatnění | 2014 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů. |
Počet výskytů výsledku | 1 |
Počet tvůrců celkem | 2 |
Počet domácích tvůrců | 2 |
Výčet všech uvedených jednotlivých tvůrců | Partha Pakray (státní příslušnost: IN - Indická republika, domácí tvůrce: A) Petr Sojka (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 7883927) |
Popis výsledku v anglickém jazyce | We present an architecture for scientific document retrieval. An existing system for textual and math-ware retrieval Math Indexer and Searcher MIaS is designed for extensions by modules for textual and math-aware entailment. The goal is to increase quality of retrieval (precision and recall) by handling natural languge variations of expressing semantically the same in texts and/or formulae. Entailment modules are designed to use several, ordered layers of processing on lexical, syntactic and semantic levels using natural language processing tools adapted for handling tree structures like mathematical formulae. If these tools are not able to decide on the entailment, generic knowledge databases are used deploying distributional semantics methods and tools. It is shown that sole use of distributional semantics for semantic textual entailment decisions on sentence level is surprisingly good. Finally, further research plans to deploy results in the digital mathematical libraries are outlin |
Klíčová slova oddělená středníkem | natural language representation; priming; lexical priming; semantic priming; data discretization; language modelling; representation of meaning; personal mental lexicon; empirical linguistics |
Stránka www, na které se nachází výsledek | https://doi.dx.org/10.13140/2.1.4036.2561 |
DOI výsledku | 10.13140/2.1.4036.2561 |