Till sidans topp

Sidansvarig: Webbredaktion
Sidan uppdaterades: 2012-09-11 15:12

Tipsa en vän
Utskriftsversion

Predicting proficiency le… - Göteborgs universitet Till startsida
Webbkarta
Till innehåll Läs mer om hur kakor används på gu.se

Predicting proficiency levels in learner writings by transferring a linguistic complexity model from expert-written coursebooks

Paper i proceeding
Författare Ildikó Pilán
Elena Volodina
Torsten Zesch
Publicerad i Proceedings of the 26th International Conference on Computational Linguistics (COLING), December 13-16, 2016, Osaka
ISBN 978-4-87974-702-0
ISSN 1525-2477
Publiceringsår 2016
Publicerad vid Institutionen för svenska språket
Språk en
Länkar coling2016.anlp.jp/doc/main.pdf
https://spraakbanken.gu.se/sites/sp...
Ämnesord proficiency levels, machine learning, learner essay classification
Ämneskategorier Språkteknologi (språkvetenskaplig databehandling)

Sammanfattning

The lack of a sufficient amount of data tailored for a task is a well-recognized problem for many statistical NLP methods. In this paper, we explore whether data sparsity can be successfully tackled when classifying language proficiency levels in the domain of learner-written output texts. We aim at overcoming data sparsity by incorporating knowledge in the trained model from another domain consisting of input texts written by teaching professionals for learners. We compare different domain adaptation techniques and find that a weighted combination of the two types of data performs best, which can even rival systems based on considerably larger amounts of in-domain data. Moreover, we show that normalizing errors in learners’ texts can substantially improve classification when in-domain data with annotated proficiency levels is not available.

Sidansvarig: Webbredaktion|Sidan uppdaterades: 2012-09-11
Dela:

På Göteborgs universitet använder vi kakor (cookies) för att webbplatsen ska fungera på ett bra sätt för dig. Genom att surfa vidare godkänner du att vi använder kakor.  Vad är kakor?