Till sidans topp

Sidansvarig: Webbredaktion
Sidan uppdaterades: 2012-09-11 15:12

Tipsa en vän
Utskriftsversion

ArbDialectID at MADAR Sha… - Göteborgs universitet Till startsida
Webbkarta
Till innehåll Läs mer om hur kakor används på gu.se

ArbDialectID at MADAR Shared Task 1: Language Modelling and Ensemble Learning for Fine Grained Arabic Dialect Identification

Paper i proceeding
Författare Chatrine (kathrein) Qwaider (abu kwaik)
Motaz Saad
Publicerad i Proceedings of the Fourth Arabic Natural Language Processing Workshop, Jul 28-Aug 02, 2019, Florence, Italy. pp. 254-258
ISBN 978-1-950737-32-1
Förlag Association for Computational Linguistics
Förlagsort Stroudsburg, PA, USA
Publiceringsår 2019
Publicerad vid Institutionen för filosofi, lingvistik och vetenskapsteori
Språk en
Länkar https://doi.org/10.18653/v1/W19-463...
Ämneskategorier Jämförande språkvetenskap och lingvistik, Språkteknologi (språkvetenskaplig databehandling), Lingvistik, Arabiska, Datorlingvistik

Sammanfattning

In this paper we present a Dialect Identifica- tion system (ArbDialectID) that competed at Task 1 of the MADAR shared task, MADAR Travel Domain Dialect Identification. We build a coarse and a fine grained identification model to predict the label (corresponding to a dialect of Arabic) of a given text. We build two language models by extracting features at two levels (words and characters). We firstly build a coarse identification model to classify each sentence into one out of six dialects, then use this label as a feature for the fine-grained model that classifies the sentence among 26 dialects from different Arab cities, after that we apply ensemble voting classifier on both subsystems. Our system ranked 1st that achieving an f-score of 67.32%. Both the models and our feature engineering tools are made available to the research community.

Sidansvarig: Webbredaktion|Sidan uppdaterades: 2012-09-11
Dela:

På Göteborgs universitet använder vi kakor (cookies) för att webbplatsen ska fungera på ett bra sätt för dig. Genom att surfa vidare godkänner du att vi använder kakor.  Vad är kakor?