Identifikační kód | RIV/00216224:14330/11:00073202 |
Název v anglickém jazyce | Stabilizing the Recall in Similarity Search |
Druh | D - Článek ve sborníku |
Jazyk | eng - angličtina |
Obor - skupina | I - Informatika |
Obor | IN - Informatika |
Rok uplatnění | 2011 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů. |
Počet výskytů výsledku | 3 |
Počet tvůrců celkem | 3 |
Počet domácích tvůrců | 3 |
Výčet všech uvedených jednotlivých tvůrců | Martin Kyselák (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 2448815) David Novák (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 3445771) Pavel Zezula (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 3165647) |
Popis výsledku v anglickém jazyce | The recent techniques for approximate similarity search focus on optimizing answer precision/recall and they typically improve the average of these measures over a set of sample queries. However, according to our observation, the recall for particular indexes and queries can fluctuate considerably. In order to stabilize the recall, we propose a query-evaluation model that exploits several variants of the search index. This approach is applicable to a signicant subset of current approximate methods witha focus on techniques based purely on metric postulates. Applying this approach to the M-Index structure, we perform extensive measurements on large datasets and we show that this approach has a positive impact on the recall stability and it suppresses the most unsatisfactory cases. Further, the results indicate that the proposed approach can also increase the general average recall for given overall search costs. |
Klíčová slova oddělená středníkem | locality-sensitive hashing; metric space; similarity search; recall; stability |
Stránka www, na které se nachází výsledek | - |
DOI výsledku | 10.1145/1995412.1995422 |