Identifikační kód | RIV/00216224:14330/12:00062319 |
Název v anglickém jazyce | Building A Thesaurus Using LDA-Frames |
Druh | D - Článek ve sborníku |
Jazyk | eng - angličtina |
Obor - skupina | I - Informatika |
Obor | IN - Informatika |
Rok uplatnění | 2012 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů. |
Počet výskytů výsledku | 1 |
Počet tvůrců celkem | 1 |
Počet domácích tvůrců | 1 |
Výčet všech uvedených jednotlivých tvůrců | Jiří Materna (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 5438233) |
Popis výsledku v anglickém jazyce | In this paper we present a new method for measuring semantic relatedness of lexical units, which can be used to generate a thesaurus automatically. The method is based on a comparison of probability distributions of semantic frames generated using the LDA-frames algorithm. The idea is evaluated by measuring the overlap of WordNet synsets and generated semantic clusters. The results show that the method outperforms another automatic approach used in the Sketch Engine project. |
Klíčová slova oddělená středníkem | LDA-frames; thesaurus |
Stránka www, na které se nachází výsledek | http://raslan2012.nlp-consulting.net/ |