Länkstig

Historien och samtiden studeras genom språkteknologin

Nina Tahmasebi

Med hjälp av språkteknologin ökar möjligheterna att studera historiska och samtida texter och kultur. Det berättar Nina Tahmasebi, som är ny postdoc vid Centrum för digital humaniora från och med årsskiftet.

Nina Tahmasebi är tjänstledig från Språkbanken i två år för att genomföra sin postdoc vid Centrum för digital humaniora. Hennes arbete går ut på att undersöka ord – både ordens betydelse och den information som orden tillsammans ger upphov till.
– Det handlar om hur orden förändras över tid. Inte formen, utan betydelsen. Ett exempel är ordet ”rolig” som idag har en positiv betydelse, men förr i tiden betydde det ”lugn”. Många värdeord har ändrat betydelse och värdeladdning över tid, säger Nina Tahmasebi.

Ordböcker saknas

Något som försvårar textanalys är att stavningen av vissa ord kan variera. Ordet ”kvinna” har förr stavats både ”qvinna” och ”quinna”. Men med hjälp av de språkteknologiska verktygen kan vi få reda på hur ordet kvinna använts i olika texter, oavsett hur det stavats genom tiderna.
– Bara för att vi inte hittar ordet ”kvinna” i 1800-talstexter betyder det inte att man inte skrev om kvinnor på 1800-talet, utan det kanske stavades på ett annat sätt. Det ger oss ökade möjligheter att studera vår kultur, säger Nina Tahmasebi.

Med hjälp av analyserna som Nina Tahmasebi gör, blir det lättare att hitta relevanta data och att analysera och tolka gamla texter.
– Vi har stor hjälp av ordböcker, men vi har inte digitaliserade ordböcker för varje tidsperiod och ordböcker fungerar som referens, vi vet inte hur folk faktiskt använde olika ord och koncept.

Ökad representation ger ökade möjligheter

Det är inte bara gamla texter och betydelseförändringar som intresserar henne. I takt med ett ökat textflöde på internet har också textmaterialet blivit mer omfattande och ger oss större möjligheter att studera vår samtid.
– Det finns en större representation idag. Förr fick inte alla publicera sig hur som helst och de som fick publicera sig måste följa mer eller mindre strikta normer. Inom sociala medier saknas dessa normer och i och med det så ser vi att många ord kommer och går och att variationerna lever kortare tid, säger Nina Tahmasebi.

Nina Tahmasebi och hennes kollegor på Språkbanken arbetar för närvarande med att bygga sentimentlexikon och verktyg för svenska språket för att under valrörelsen 2018 kunna studera samhällsdebatten.