Identifikační kód | RIV/00216224:14330/14:00094187 |
Název v anglickém jazyce | Effective Corpus Virtualization |
Druh | D - Článek ve sborníku |
Jazyk | eng - angličtina |
Obor - skupina | I - Informatika |
Obor | IN - Informatika |
Rok uplatnění | 2014 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů. |
Počet výskytů výsledku | |
Počet tvůrců celkem | 3 |
Počet domácích tvůrců | 2 |
Výčet všech uvedených jednotlivých tvůrců | Miloš Jakubíček (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 5837189) Pavel Rychlý (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 6616844) Adam Kilgarriff (státní příslušnost: GB - Spojené království Velké Británie a Severního Irska) |
Popis výsledku v anglickém jazyce | In this paper we describe an implementation of corpus virtualization within the Manatee corpus management system. Under corpus virtualization we understand logical manipulation with corpora or their parts grouping them into new (virtual) corpora. We discuss the motivation for such a setup in detail and show space and time efficiency of this approach evaluated on a 11 billion word corpus of Spanish. |
Klíčová slova oddělená středníkem | corpus;corpus linguistics;virtualization;indexing;database |
Stránka www, na které se nachází výsledek | - |