Länkstig

Språksläktskap identifieras med automatisk dateringsmetod

Publicerad

Idag finns det mer än 7 000 språk i världen indelade i över 400 språkfamiljer. En avhandling i språkvetenskaplig databehandlingpresenterar en dateringsmetod som kan användas för att uppskatta bland annat tidpunkter för språksplittring i språkfamiljer.

Taraka RamaDatorbaserad forskning på språkhistoriska och språktypologiska data har tagit stora steg framåt de senaste femton åren. Taraka Rama har i sin forskning använt sig av storskalig datorbearbetning av listor med ett språks grundläggande ordförråd (så kallade Swadeshlistor) för en stor mängd språk för att belysa ett antal klassiska problem inom den historiska språkforskningen.

Exempel på sådana problem är att identifiera besläktade ord mellan språk, att skilja besläktade och obesläktade språk åt, att uppskatta tidpunkter för språksplittring då ett antaget urspråk har delats upp i två eller flera dotterspråk, samt att fastställa de interna släktskapsförhållandena i de språkfamiljer som uppstått genom sådan språksplittring.

− Jag har utvecklat metoder för automatisk identifiering av språks genetiska släktskap och testat mina resultat mot redan kända klassificeringar av språk. På samma sätt har jag tagit fram en metod för att uppskatta en språkfamiljs ålder.

Taraka Rama har verifierat sin metod genom jämförelse av de språkfamiljsstrukturer han får fram vid datorbearbetning av ordlistor med de familjeträd där man redan vet språkfamiljens ålder eller hur språken i en familj är besläktade. Till exempel vet man mycket om hur uppdelningen ser ut i de slaviska, germanska och romanska språken.

Den dateringsmetod som Taraka Rama utvecklat och presenterar i sin avhandling kan användas för att uppskatta tidpunkter för språksplittring i vilken språkfamilj som helst. Han har också tagit fram en metod för att automatiskt identifiera ord på två språk som härstammar från ett gemensamt språk som inte längre existerar.

− Sammantaget kan min avhandling ses som ett bidrag till att mäta skillnader och likheter mellan språken i världen, säger han.

Avhandlingen Studies in computational historical linguistics. Models and analyses försvarades den 13 november 2015.