Identifikační kód | RIV/00216224:14330/14:00077510 |
Název v anglickém jazyce | Improving Coverage of Translation Memories with Language Modelling |
Druh | D - Článek ve sborníku |
Jazyk | eng - angličtina |
Obor - skupina | I - Informatika |
Obor | IN - Informatika |
Rok uplatnění | 2014 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů. |
Počet výskytů výsledku | 1 |
Počet tvůrců celkem | 3 |
Počet domácích tvůrců | 3 |
Výčet všech uvedených jednotlivých tvůrců | Vít Baisa (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 9652353) Josef Bušta (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 8290318) Aleš Horák (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 3161870) |
Popis výsledku v anglickém jazyce | In this paper, we describe and evaluate current improvements to methods for enlarging translation memories. In comparison with the previous results in 2013, we have achieved improvement in coverage by almost 35 percentage points on the same test data. The basic subsegment splitting of the translation pairs is done using Moses and (M)GIZA++ tools, which provide the subsegment translation probabilities. The obtained phrases are then combined with subsegment combination techniques and filtered by large target language models. |
Klíčová slova oddělená středníkem | translation memory; CAT; segment; subsegment leveraging; partial translation; Moses; GIZA++; word matrix; METEOR; MemoQ; language model |
Stránka www, na které se nachází výsledek | - |