Identifikační kód | RIV/00216224:14330/11:00054043 |
Název v anglickém jazyce | A Bayesian Approach to Query Language Identification |
Druh | D - Článek ve sborníku |
Jazyk | eng - angličtina |
Obor - skupina | I - Informatika |
Obor | IN - Informatika |
Rok uplatnění | 2011 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů. |
Počet výskytů výsledku | 1 |
Počet tvůrců celkem | 2 |
Počet domácích tvůrců | 2 |
Výčet všech uvedených jednotlivých tvůrců | Jiří Materna (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 5438233) Juraj Hreško (státní příslušnost: SK - Slovenská republika, domácí tvůrce: A, vedidk: 4822145) |
Popis výsledku v anglickém jazyce | In this paper we present a Bayesian approach to language identification of queries sent to an information retrieval system. The aim of the work is to identify both the language of a query as a whole and the language of particular words in the query. Themethod is evaluated on a test set of manually labelled queries. The evaluation shows that our method performs better than the Google Language Detect API and an implementation of the n-gram method on our testing set of queries. |
Klíčová slova oddělená středníkem | language identification; query language; information retrieval |
Stránka www, na které se nachází výsledek | - |