Länkstig

Projekt ska upptäcka språkförändring med hjälp av språkteknologi

Nina Tahmasebi, forskare på Språkbanken vid institutionen för svenska språket, har i dagarna fått medel för att utveckla automatiska metoder som ska kunna upptäcka språkförändringar över tid. Projektet finansieras av Vetenskapsrådet och förväntas pågå 2019–2022.

I takt med att vår värld och vår livsstil förändras, förändras även vårt språk. Vi lär oss nya ord, skaffar nya betydelser på existerande ord eller förändrar betydelser så att de passar in för att beskriva vår värld och vår tid. Vi glömmer fort och när vi tittar tillbaka i gamla dagstidningar eller böcker så är det inte alltid så lätt att förstå vad som en gång menades.

Vad kallades första världskriget medan kriget pågick?

Projektet är ett unikt samarbete mellan kvalitativa och kvantitativa metoder för att studera språkförändringar och i projektet delar man upp betydelseförändringar i två kategorier. Den första kategorin innebär att ord ändras över tid och den andra att ord ersätter varandra. Nina Tahmasebi utvecklar.

- Ordet rock är exempelvis ett ord som fått en tillagd betydelse, utöver att vara ett ytterplagg är det även en musikstil och faller därför in i den första kategorin.

Om man ska söka information i gamla tidningar eller böcker, oavsett om man gör sökningen digitalt eller analogt, så kan en sådan betydelseförändring innebära problem för att hitta relevant material. Detta gäller oavsett om den som söker är en person, eller ett datorprogram.

- Anta att vi vill hitta information om första världskriget i material från den perioden då kriget pågick. Vid den tiden kallades kriget inte för första världskriget och en sökning på detta skulle inte ge oss alla relevanta sökträffar som behandlar ämnet, säger Nina Tahmasebi.

Det är också den här typen av problem som projektet ska avhjälpa genom att bygga digitala verktyg som hanterar problematiken automatiskt – något som blir viktigare och viktigare för att hjälpa människor och datorprogram som behöver tolka äldre (och nya) texter.

Vilka ord, när och hur?

På samma sätt som det är viktigt att utarbeta automatiska sätt för att identifiera de ord som har ändrat betydelse är det också viktigt att ta reda på hur förändringarna skett. Nina Tahmasebi ser en mängd möjligheter med ett språkteknologiskt angreppssätt.

- Vi kommer att bygga verktyg som studerar vårt språk och dess förändringar i en större skala och på detta sätt hoppas vi på att kunna svara på en rad frågor. När får ett ord en ny betydelse och hur länge är betydelsen aktiv? Hur leder en förändring i ett ord till vidare förändringar i andra, besläktade ord?

Att svara på dessa frågor blir idag allt mer aktuellt eftersom historiskt material i allt högre grad blir öppet och tillgängligt digitalt. Det tilltänkta verktyget kan dessutom lika gärna användas på mer nutida material och frågorna är minst lika intressanta att besvara i kontexten av exempelvis sociala medier, där språket förändras mycket fortare.

Underlättar för forskare från alla domäner

Möjligheterna att undersöka historiskt material och stora textmängder på ett automatiskt och storskaligt vis lockar forskare från alla domäner, framförallt gäller det språkvetare men även från digial humaniora och samhällsvetenskap.

- Tanken är att dessa forskare inte ska behöva vara experter på historisk lingvistik för att kunna få tillgång till den här informationen. Allt ifrån attityden till retorik genom historien, till abstraktion av marknaden och olika politiska partiers användning av ord ska kunna studeras och gynnas av att hantera språkliga förändringar automatiskt, säger Nina Tahmasebi.

Fakta om projektet

Projektet finansieras med 5 960 000 kronor av Vetenskapsrådet och förväntas pågå 2019–2022.

Medverkande i projektet är: Richard Johansson från Chalmers tekniska högskola, Maria Koptjevskaja Tamm och Susanne Vejdemo från Stockholms universitet