Till sidans topp

Sidansvarig: Webbredaktion
Sidan uppdaterades: 2012-09-11 15:12

Tipsa en vän
Utskriftsversion

Computational evidence th… - Göteborgs universitet Till startsida
Webbkarta
Till innehåll Läs mer om hur kakor används på gu.se

Computational evidence that Hindi and Urdu share a grammar but not the lexicon

Konferensbidrag (offentliggjort, men ej förlagsutgivet)
Författare K. V. S. Prasad
Shafqat Virk
Publicerad i 3rd Workshop on South and Southeast Asian Natural Language Processing (SANLP)", collocated with COLING 12
Publiceringsår 2012
Publicerad vid Institutionen för data- och informationsteknik (GU)
Språk en
Länkar www.sanlp.org/wssanlp2012/
Ämnesord Grammatical Framework, Resource Grammars, Application Grammars
Ämneskategorier Data- och informationsvetenskap, Språkteknologi (språkvetenskaplig databehandling)

Sammanfattning

Hindi and Urdu share a grammar and a basic vocabulary, but are often mutually unintelligible because they use different words in higher registers and sometimes even in quite ordinary situations. We report computational translation evidence of this unusual relationship (it differs from the usual pattern, that related languages share the advanced vocabulary and differ in the basics). We took a GF resource grammar for Urdu and adapted it mechanically for Hindi, changing essentially only the script (Urdu is written in Perso-Arabic, and Hindi in Devanagari) and the lexicon where needed. In evaluation, the Urdu grammar and its Hindi twin either both correctly translated an English sentence, or failed in exactly the same grammatical way, thus confirming computationally that Hindi andUrdu share a grammar. But the evaluation also found that the Hindi and Urdu lexicons differed in 18% of the basic words, in 31% of tourist phrases, and in 92% of school mathematics terms.

Sidansvarig: Webbredaktion|Sidan uppdaterades: 2012-09-11
Dela:

På Göteborgs universitet använder vi kakor (cookies) för att webbplatsen ska fungera på ett bra sätt för dig. Genom att surfa vidare godkänner du att vi använder kakor.  Vad är kakor?