Till startsida
Webbkarta
Till innehåll Läs mer om hur kakor används på gu.se

Defining the Eukalyptus forest – the Koala treebank of Swedish

Paper i proceeding
Författare Yvonne Adesam
Gerlof Bouma
Richard Johansson
Publicerad i Proceedings of the 20th Nordic Conference of Computational Linguistics, NODALIDA 2015, May 11-13, 2015, Vilnius, Lithuania. Edited by Beáta Megyesi
Sidor 1-9
ISBN 978-91-7519-098-3
ISSN 1650-3686
Publiceringsår 2015
Publicerad vid Institutionen för svenska språket
Sidor 1-9
Språk en
Länkar aclweb.org/anthology/W/W15/W15-1804...
Ämnesord corpus, treebank, korpus, trädbank, annotering
Ämneskategorier Språkteknologi (språkvetenskaplig databehandling), Svenska språket

Sammanfattning

This paper details the design of the lexical and syntactic layers of a new annotated corpus of Swedish contemporary texts. In order to make the corpus adaptable into a variety of representations, the annotation is of a hybrid type with head-marked constituents and function-labeled edges, and with a rich annotation of non-local dependencies. The source material has been taken from public sources, to allow the resulting corpus to be made freely available.

Sidansvarig: Webbredaktion|Sidan uppdaterades: 2012-09-11
Dela:

På Göteborgs universitet använder vi kakor (cookies) för att webbplatsen ska fungera på ett bra sätt för dig. Genom att surfa vidare godkänner du att vi använder kakor.  Vad är kakor?