Till startsida
Webbkarta
Till innehåll Läs mer om hur kakor används på gu.se

SWORD: Towards Cutting-Edge Swedish Word Processing

Konferensbidrag (offentliggjort, men ej förlagsutgivet)
Författare Fabienne Cap
Yvonne Adesam
Lars Ahrenberg
Lars Borin
Gerlof Bouma
Markus Forsberg
Viggo Kann
Robert Östling
Aaron Smith
Mats Wirén
Joakim Nivre
Publicerad i Proceedings of the Sixth Swedish Language Technology Conference (SLTC) Umeå University, 17-18 November, 2016
Publiceringsår 2016
Publicerad vid Institutionen för svenska språket
Språk en
Länkar www8.cs.umu.se/~johanna/sltc2016/ab...
Ämneskategorier Svenska språket, Jämförande språkvetenskap och lingvistik, Språkteknologi (språkvetenskaplig databehandling)

Sammanfattning

Despite many years of research on Swedish language technology, there is still no well-documented standard for Swedish word processing covering the whole spectrum from low-level tokenization to morphological analysis and disambiguation. SWORD is a new initiative within the SWE-CLARIN consortium aiming to develop documented standards for Swedish word processing. In this paper, we report on a pilot study of Swedish tokenization, where we compare the output of six different tokenizers on four different text types. For one text type (Wikipedia articles), we also compare to the tokenization produced by six manual annotators.

Sidansvarig: Webbredaktion|Sidan uppdaterades: 2012-09-11
Dela:

På Göteborgs universitet använder vi kakor (cookies) för att webbplatsen ska fungera på ett bra sätt för dig. Genom att surfa vidare godkänner du att vi använder kakor.  Vad är kakor?