Identifikační kód | RIV/00216224:14330/14:00073219 |
Název v anglickém jazyce | Performance Study of Independent Anchor Spaces for Similarity Searching |
Druh | J - Článek v odborném periodiku |
Jazyk | eng - angličtina |
Obor - skupina | I - Informatika |
Obor | IN - Informatika |
Rok uplatnění | 2014 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů. |
Počet výskytů výsledku | 2 |
Počet tvůrců celkem | 2 |
Počet domácích tvůrců | 2 |
Výčet všech uvedených jednotlivých tvůrců | David Novák (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 3445771) Pavel Zezula (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 3165647) |
Popis výsledku v anglickém jazyce | This work targets the problem of search efficiency vs. answer quality of approximate metric-based similarity search. We especially focus on techniques based on recursive Voronoi-like partitioning or, from another perspective, on pivot permutations. Thesetechniques use sets of reference objects (anchors/pivots) to partition the metric space into cells of close data items. Instead of refining the search space by enlarging the anchor set of a single index, we propose to divide a large pivot set into several subsets and build multiple indexes with independent space partitioning; at query time, the overall search costs are also divided among the separate indexes. Our thorough experimental study on three different real datasets uncovers drawbacks of excessive increase of a single pivot set size?such partitioning refinement can be counterproductive beyond a certain number of pivots. Our approach overcomes the root causes of this limitation and increases the answer quality while preserving th |
Klíčová slova oddělená středníkem | similarity search; metric space; multi-index; efficiency; robustness |
Stránka www, na které se nachází výsledek | http://comjnl.oxfordjournals.org/content/57/11/1741 |
DOI výsledku | 10.1093/comjnl/bxt114 |