Bild
Porträtt på doktoranded Niklas Deworetzki
Niklas Deworetzki forskar i gränslandet mellan datavetenskap och lingvistik.
Foto: Natalija Sako
Länkstig

Han bygger IT-lösningar som stöttar framtidens språkforskning

Publicerad

Att kunna söka i ett textmaterial på 16 miljarder ord och på en bråkdels sekund få korrekta svar, det är målet med Niklas Deworetzkis forskning. Som doktorand i datavetenskap utvecklar han verktyg som gör det möjligt för språkforskare och samhällsvetare att snabbt göra avancerade sökningar i stora mängder text.

– Jag brukar säga att jag bygger verktyg för andra forskare. De gör den stora insatsen för världen och jag hjälper dem att hjälpa sig själva, säger doktoranden Niklas Deworetzki, vars forskning handlar om att skapa databassystem för stora datamängder. 

– Forskarna ska lätt kunna göra en sökning, oavsett hur komplex den är, och få ett resultat så snabbt som möjligt. Verktygen behöver därför vara effektiva, men också begripliga och användbara.  

Samarbete över ämnesgränser 

Forskningen som Niklas Deworetzki bedriver befinner sig i gränslandet mellan datavetenskap och lingvistik, vilket innebär att han som datavetare samarbetar med humanistiska och samhällsvetenskapliga forskare. Tillsammans arbetar de just nu med en samling språkliga data på över 16 miljarder ord i den nationella resursen Språkbanken. Niklas Deworetzkis uppgift är att ”uppgradera” sökfunktionen i databasen. Det görs genom att bygga ett nytt tekniskt lager ovanpå det gamla systemet, som gör att sökfunktionen exempelvis kan förstå modernare sökspråk. 

– Det finns redan sökverktyg för de här samlingarna, men en sökning kan ta uppemot tio minuter. Om forskaren behöver justera sökvillkoren måste hen vänta lika länge igen. Med vår prototyp kan vi söka igenom hela svenska Wikipedia på omkring 100 millisekunder, säger Niklas Deworetzki. 

Med hjälp av sökningarna kan humanister och samhällsvetare studera exempelvis hur politiska partier talar om olika ämnen och hur språket förändras över tid. De senaste årens AI-utveckling har haft stor påverkan på lingvistikforskningen, genom exempelvis automatisering av språkanalys eller identifiering av minoritetsspråk. Men den datavetenskapliga sidan är än så länge relativt opåverkad av AI, förklarar Niklas Deworetzki. 

– Min del handlar mer om ren matematik, där vi försöker bygga generella system som alltid gör rätt och där du kan bevisa varför de fungerar som de ska. Vi behöver inte producera mycket kod, utan kod som är den bästa möjliga versionen av det vi försöker göra – och det är helt enkelt svårt för AI. 

Bild
Porträtt på Niklas Deworetski
På Göteborgs universitet finns mycket stöd att få som doktorand, berättar Niklas Deworetzki.
Foto: Natalija Sako

Nyupptäckt intresse för språk 

Niklas Deworetzki trodde aldrig att han skulle arbeta med språk, och ännu mindre språkdatabaser på ett helt nytt språk. Men flytten från Tyskland till Sverige, och mötet med kollegor från världens alla hörn, har väckt en ny fascination för språk. 

– Jag gillar verkligen att lära mig om skillnader mellan språk och roliga uttryck som jag får höra från de andra doktoranderna, som att portugisiskan kallar vader ”benens potatisar”. Efter flytten till Sverige har jag också fått en ny uppskattning för mitt eget modersmål, tyskan. Ta bara tyskans ord för träningsvärk: muskelbaksmälla. Det är otroligt. 

Niklas Deworetzkis utbildningsbakgrund har helt fokuserat på datavetenskap, ända sedan han i gymnasiet lärde sig programmera för att skapa egna spel i Minecraft. Under utbildningen väcktes även ett intresse för forskning. Efter att ha arbetat som utvecklare några år valde han därför att söka sig tillbaka till akademin. 

– Jag upplevde arbetet inom industrin som repetitivt och ville tillbaka till den kreativa världen på universitetet. Inom forskningen finns det så många nyfikna och passionerade människor, säger Niklas Deworetzki. 

Bra stöd för doktorander på Göteborgs universitet 

Eftersom forskningsfältet han nu doktorerar inom var helt nytt för honom blev starten en utmaning. Han behövde hitta sin nisch och förstå vilka problem som faktiskt är intressanta och viktiga. Stödet från handledarna och forskningsmiljön vid Göteborgs universitet har därför varit avgörande. 

– Jag upplevde tidigt att Göteborgs universitet verkligen bryr sig om doktorander. Det finns program, kurser och stödstrukturer som gör att man får möjlighet att växa. Och kollegorna är otroligt värdefulla, jag hade ingen aning om hur många fantastiska personer jag skulle få runt mig när jag flyttade hit, säger han. 

Vad som händer framöver vet han inte. Han är öppen för att stanna i Sverige men kan även tänka sig att flytta utomlands. Det enda han vet helt säkert är att han vill fortsätta programmera. 

– Jag vill fortsätta arbeta med programmeringsspråk och verktyg som kan hjälpa människor.

 

Text: Natalija Sako

 

Niklas Deworetzki

Ålder: 26 

Uppväxt: Herborn, Tyskland 

Fritidsintresse: Naturen, vandring, foto

Kuriosa: Har varit inne i en partikelaccelerator och druckit ur den svenska pokalen i ishockey.