Till startsida
Webbkarta
Till innehåll Läs mer om hur kakor används på gu.se

A Multi-domain Corpus of Swedish Word Sense Annotation

Paper i proceeding
Författare Richard Johansson
Yvonne Adesam
Gerlof Bouma
Karin Hedberg
Publicerad i 10th edition of the Language Resources and Evaluation Conference, 23-28 May 2016, Portorož (Slovenia)
ISBN 978-2-9517408-9-1
Förlag European Language Resources Association
Publiceringsår 2016
Publicerad vid Institutionen för svenska språket
Institutionen för data- och informationsteknik (GU)
Språk en
Länkar dflund.se/~richardj/pdf/lrec2016_ws...
lrec-conf.org/proceedings/lrec2016/...
Ämnesord ordbetydelsedisambiguering, word sense disambiguation, lexical semantics, corpora, annotation
Ämneskategorier Lingvistik, Datorlingvistik, Språkteknologi (språkvetenskaplig databehandling)

Sammanfattning

We describe the word sense annotation layer in Eukalyptus, a freely available five-domain corpus of contemporary Swedish with several annotation layers. The annotation uses the SALDO lexicon to define the sense inventory, and allows word sense annotation of compound segments and multiword units. We give an overview of the new annotation tool developed for this project, and finally present an analysis of the inter-annotator agreement between two annotators.

Sidansvarig: Webbredaktion|Sidan uppdaterades: 2012-09-11
Dela:

På Göteborgs universitet använder vi kakor (cookies) för att webbplatsen ska fungera på ett bra sätt för dig. Genom att surfa vidare godkänner du att vi använder kakor.  Vad är kakor?