Identifikační kód | RIV/00216224:14330/11:00067252 |
Název v anglickém jazyce | Subspace Tracking for Latent Semantic Analysis |
Druh | D - Článek ve sborníku |
Jazyk | eng - angličtina |
Obor - skupina | B - Fyzika a matematika |
Obor | BD - Teorie informace |
Rok uplatnění | 2011 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů. |
Počet výskytů výsledku | 2 |
Počet tvůrců celkem | 1 |
Počet domácích tvůrců | 1 |
Výčet všech uvedených jednotlivých tvůrců | Radim Řehůřek (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 3548988) |
Popis výsledku v anglickém jazyce | Modern applications of Latent Semantic Analysis (LSA) must deal with enormous (often practically infinite) data collections, calling for a single-pass matrix decomposition algorithm that operates in constant memory w.r.t. the collection size. This paperintroduces a emph{streamed distributed algorithm for incremental SVD updates}. Apart from the theoretical derivation, we present experiments measuring numerical accuracy and runtime performance of the algorithm over several data collections, one of which is the whole of the English Wikipedia. |
Klíčová slova oddělená středníkem | scalability svd subspace tracking |
Stránka www, na které se nachází výsledek | - |
DOI výsledku | 10.1007/978-3-642-20161-5_29 |