RIV/00216224:14330/11:00067289 - Indexing and Searching Mathematics in Digital Libraries -- Architecture, Design and Scalability Issues (2011)

Údaje o výsledku
Identifikační kódRIV/00216224:14330/11:00067289
Název v původním jazyceIndexing and Searching Mathematics in Digital Libraries -- Architecture, Design and Scalability Issues
DruhD - Článek ve sborníku
Jazykeng - angličtina
OborIN - Informatika
Rok uplatnění2011
Kód důvěrnosti údajůS - Úplné a pravdivé údaje nepodléhající ochraně podle zvláštních právních předpisů
Počet výskytů výsledku2
Údaje z Hodnocení výsledků výzkumných organizací 2014
Výsledek byl hodnocen v Pilíři I
Rozsah vyřazení výsledkuTento výskyt výsledku není vyřazen
Zařazení výsledku v hodnoceníD - Článek ve sborníku
Skupina oboru v hodnocení04 - Technické a informatické vědy
Konkrétní způsob(y) hodnocení výsledkuČlánek ve sborníku evidovaném v databázi Scopus bodovaný podle SJR zdroje typu Book Series nebo Conference Proceedings
Bodové ohodnocení53,461
Faktor korekce100,9 %
Body (upravené podle přílohy č. 8 Metodiky)53,957
Rozdělení výsledku mezi předkladatele
OrganizaceVýzkumná organizace?PodílBodyBody (upravené podle přílohy č. 8 Metodiky)
Masarykova univerzita / Fakulta informatikyano100,0 %53,46153,957
Tvůrci výsledku
Počet tvůrců celkem2
Počet domácích tvůrců2
TvůrceSojka Petr (státní příslušnost: CZ - Česká republika; A - domácí tvůrce; vedidk: 7883927)
TvůrceLíška Martin (státní příslušnost: SK - Slovenská republika; A - domácí tvůrce; vedidk: 4357469)
Údaje blíže specifikující výsledek
Popis v původním jazyceThis paper surveys approaches and systems for searching mathematical formulae in mathematical corpora and on the web. The design and architecture of our MIaS (Math Indexer and Searcher) system is presented, and our design decisions are discussed in detail. An approach based on Presentation MathML using a similarity of math subformulae is suggested and verified by implementing it as a math-aware search engine based on the state-of-the-art system, Apache Lucene. Scalability issues were checked based on 324,000 real scientific documents from arXiv archive with 112 million mathematical formulae. More than two billions MathML subformulae were indexed using our Solr-compatible Lucene extension.
Klíčová slovamath indexing and retrieval; mathematical digital libraries; information systems; information retrieval; mathematical content search; document ranking of mathematical papers; math text mining; MIaS; WebMIaS
Rozsah stran228-243
Název sborníkuIntelligent Computer Mathematics Lecture Notes in Computer Science, 2011, Volume 6824/2011
Forma vydáníP - Tištěná verze „print“
ISSN0302-9743
Počet stran výsledku16
ISBN9783642226724
Název nakladateleSpringer-Verlag
Místo vydáníBerlin / Heidelberg
Místo konání akceBertinoro, Italy
Datum zahájení akce18.7.2011
Typ akce podle státní příslušnoti účastníkůWRD - Světová
DOI výsledku10.1007/978-3-642-22673-1_16
Údaje o tomto záznamu o výsledku
PředkladatelMasarykova univerzita / Fakulta informatiky
DodavatelMSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT)
Rok sběru2014
Systémové označení dodávky datRIV14-MSM-14330___/01:1
SpecifikaceRIV/00216224:14330/11:00067289!RIV14-MSM-14330___
Kontrolní kód[75A1A877FDF9]
Další výskyty tohoto výsledku od stejného předkladatele
Dodáno MŠMT v roce 2012Záznam s identifikačním kódem RIV/00216224:14330/11:00052712 v dodávce dat RIV12-MSM-14330___/01:1
Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl
ProjektLA09016 - Účast ČR v European Research Consortium for Informatics and Mathematics (ERCIM) (2009-2012, MSM/LA)
S - Specifický výzkum na vysokých školách