Identifikační kód | RIV/00216224:14330/11:00073198 |
Název v anglickém jazyce | Metric index: an efficient and scalable solution for precise and approximate similarity search |
Druh | J - Článek v odborném periodiku |
Jazyk | eng - angličtina |
Obor - skupina | I - Informatika |
Obor | IN - Informatika |
Rok uplatnění | 2011 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů. |
Počet výskytů výsledku | 2 |
Počet tvůrců celkem | 3 |
Počet domácích tvůrců | 3 |
Výčet všech uvedených jednotlivých tvůrců | David Novák (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 3445771) Michal Batko (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 8876398) Pavel Zezula (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 3165647) |
Popis výsledku v anglickém jazyce | Metric space is a universal and versatile model of similarity that can be applied in various areas of information retrieval. However, a general, efficient, and scalable solution for metric data management is still a resisting research challenge. We introduce a novel indexing and searching mechanism called Metric Index (M-Index) that employs practically all known principles of metric space partitioning, pruning, and filtering, thus reaching high search performance while having constant building costs perobject. The heart of the M-Index is a general mapping mechanism that enables to actually store the data in established structures such as the B+ - tree or even in a distributed storage. We implemented the M-Index with the B+ - tree and performed experiments on two datasets - the first is an artificial set of vectors and the other is a real-life dataset composed of a combination of five MPEG-7 visual descriptors extracted from a database of up to several million digital images. |
Klíčová slova oddělená středníkem | Metric space; Similarity search; Data structure; Approximation; Scalability |
Stránka www, na které se nachází výsledek | - |
DOI výsledku | 10.1016/j.is.2010.10.002 |