Till sidans topp

Sidansvarig: Webbredaktion
Sidan uppdaterades: 2012-09-11 15:12

Tipsa en vän
Utskriftsversion

The SweLL Language Learne… - Göteborgs universitet Till startsida
Webbkarta
Till innehåll Läs mer om hur kakor används på gu.se

The SweLL Language Learner Corpus: From Design to Annotation

Artikel i vetenskaplig tidskrift
Författare Elena Volodina
Lena Granstedt
Arild Matsson
Beáta Megyesi
Ildikó Pilán
Julia Prentice
Dan Rosén
Lisa Rudebeck
Carl-Johan Schenström
Gunlög Sundberg
Mats Wirén
Publicerad i Northern European Journal of Language Technology
Volym 6
ISSN 2000-1533
Publiceringsår 2019
Publicerad vid Institutionen för svenska språket
Språk en
Ämnesord SweLL, Learner Corpus Research (LCR), Second Language Infrastructure, Correction annotation, Error annotation, normalization, pseudonymization, SVALA
Ämneskategorier Språkteknologi (språkvetenskaplig databehandling), Lärande, Jämförande språkvetenskap och lingvistik, Lingvistik, Nordiska språk, Språkstudier, Språk och litteratur

Sammanfattning

The article presents a new language learner corpus for Swedish, SweLL, and the methodology from collection and pesudonymisation to protect personal information of learners to annotation adapted to second language learning. The main aim is to deliver a well-annotated corpus of essays written by second language learners of Swedish and make it available for research through a browsable environment. To that end, a new annotation tool and a new project management tool have been implemented, – both with the main purpose to ensure reliability and quality of the final corpus. In the article we discuss reasoning behind metadata selection, principles of gold corpus compilation and argue for separation of normalization from correction annotation.

Sidansvarig: Webbredaktion|Sidan uppdaterades: 2012-09-11
Dela:

På Göteborgs universitet använder vi kakor (cookies) för att webbplatsen ska fungera på ett bra sätt för dig. Genom att surfa vidare godkänner du att vi använder kakor.  Vad är kakor?