Till sidans topp

Sidansvarig: Webbredaktion
Sidan uppdaterades: 2012-09-11 15:12

Tipsa en vän
Utskriftsversion

Training Word Sense Embed… - Göteborgs universitet Till startsida
Webbkarta
Till innehåll Läs mer om hur kakor används på gu.se

Training Word Sense Embeddings With Lexicon-based Regularization

Paper i proceeding
Författare Luis Nieto Piña
Richard Johansson
Publicerad i Proceedings of the Eighth International Joint Conference on Natural Language Processing (Volume 1: Long Papers), Taipei, Taiwan, November 27 – December 1, 2017
ISBN 978-1-948087-00-1
Förlag Asian Federation of Natural Language Processing
Publiceringsår 2017
Publicerad vid Institutionen för svenska språket
Institutionen för data- och informationsteknik (GU)
Språk en
Länkar www.aclweb.org/anthology/I17-1029
Ämnesord natural language processing, swedish language, lexicon, embedding, neural network, semantics, meaning representation
Ämneskategorier Databehandling, Språkteknologi (språkvetenskaplig databehandling)

Sammanfattning

We propose to improve word sense embeddings by enriching an automatic corpus-based method with lexicographic data. Information from a lexicon is introduced into the learning algorithm’s objective function through a regularizer. The incorporation of lexicographic data yields embeddings that are able to reflect expertdefined word senses, while retaining the robustness, high quality, and coverage of automatic corpus-based methods. These properties are observed in a manual inspection of the semantic clusters that different degrees of regularizer strength create in the vector space. Moreover, we evaluate the sense embeddings in two downstream applications: word sense disambiguation and semantic frame prediction, where they outperform simpler approaches. Our results show that a corpusbased model balanced with lexicographic data learns better representations and improve their performance in downstream tasks

Sidansvarig: Webbredaktion|Sidan uppdaterades: 2012-09-11
Dela:

På Göteborgs universitet använder vi kakor (cookies) för att webbplatsen ska fungera på ett bra sätt för dig. Genom att surfa vidare godkänner du att vi använder kakor.  Vad är kakor?