Identifikační kód | RIV/00216224:14330/14:00077507 |
Název v anglickém jazyce | A System for Predictive Writing |
Druh | D - Článek ve sborníku |
Jazyk | eng - angličtina |
Obor - skupina | A - Společenské vědy |
Obor | AI - Jazykověda |
Rok uplatnění | 2014 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů. |
Počet výskytů výsledku | 1 |
Počet tvůrců celkem | 2 |
Počet domácích tvůrců | 2 |
Výčet všech uvedených jednotlivých tvůrců | Zuzana Nevěřilová (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 6670288) Barbora Ulipová (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 3982963) |
Popis výsledku v anglickém jazyce | Most predictive writing systems are based on n-gram model with different size. Systems designed for English are easier than those for flective languages since even smaller models allow reasonable coverage. However, the same corpus size is significantly insufficient for languages with many word forms. The paper presents a new predictive writing system based on n-grams calculated from a large corpus. We designed the high-performance server-side script that returns either the most probable endings of a word or the most probable following words. We also designed the client-side script that is suitable for desktop computers without touchscreens. We calculated 150 millions most frequent n-grams for n = 1, . . . , 12 from a Czech corpus and evaluated the writing system on Czech texts. The system was then extended by custom-built model that can consist of domain or user specific n-grams. |
Klíčová slova oddělená středníkem | predictive writing; n-gram language model; corpus; KSPC |
Stránka www, na které se nachází výsledek | - |