Identifikační kód | RIV/00216224:14330/11:00053999 |
Název v anglickém jazyce | Building Corpora of Technical Texts : Approaches and Tools |
Druh | D - Článek ve sborníku |
Jazyk | eng - angličtina |
Obor - skupina | I - Informatika |
Obor | IN - Informatika |
Rok uplatnění | 2011 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů. |
Počet výskytů výsledku | 1 |
Počet tvůrců celkem | 3 |
Počet domácích tvůrců | 3 |
Výčet všech uvedených jednotlivých tvůrců | Petr Sojka (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 7883927) Martin Líška (státní příslušnost: SK - Slovenská republika, domácí tvůrce: A, vedidk: 4357469) Michal Růžička (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 9619097) |
Popis výsledku v anglickém jazyce | Building corpora of technical texts in Science, Technology, Engineering, and Mathematics (STEM) domain has its specific needs, especially the handling of mathematical formulae. In particular, there is no widely accepted format to represent and handle math. We present an approach based on multiple representations of mathematical formulae that has been used for math retrieval, similarity and clustering of mathematical corpus. We provide an overview of our toolset, summarize our experiments to date and propose further research directions and approaches. |
Klíčová slova oddělená středníkem | language of mathematics; mathematics of language; math representation; m-term; similarity; DML-CZ; EuDML |
Stránka www, na které se nachází výsledek | - |