Språkteknologi
Språkteknologi är en del av artificiell intelligens (AI) – ett område inom datavetenskapen som utvecklar system som kan utföra uppgifter som vanligtvis kräver mänsklig intelligens, såsom inlärning, resonemang och problemlösning. Språkteknologi är särskilt inriktad på att förstå, tolka och generera mänskligt språk. Forskning inom språkteknologi bedrivs huvudsakligen av forskare vid enheten Språkbanken Text.
Språkbanken Text
Språkbanken Text är del av Språkbanken, en nationell e-infrastruktur till stöd för forskning baserad på språkliga data. Här utvecklas, förädlas och tillgängliggörs fria språkliga forskningsdata, med ett särskilt fokus på svenska språket genom tiderna. Språkbanken Text utvecklar och tillgängliggör fria digitala forskningsplattformar, där vi strävar efter att stödja alla typer av forskning där språkliga data är centrala. Här bedrivs egen forskning i språkteknologi, inklusive språkbaserad AI, samt projekt i samarbete med andra discipliner.
Språkteknologi i praktiken
Språkteknologi spelar en allt viktigare roll i forskningsansatser inom en rad vetenskapliga discipliner, bland annat lingvistik, historia, sociologi, statsvetenskap, lexikografi, litteraturvetenskap och utbildning. Exempel på välkända praktiska tillämpningar av språkteknologi är Google Translate, ChatGPT, Grammarly samt andra allmänt använda verktyg såsom Siri och DeepL.
Forskning vid Språkbanken Text
Språkbanken Text arbetar främst med att möjliggöra för datorer att bearbeta mänskligt språk i textform. När språkteknologi tillämpas inom och integreras med humaniora – med hjälp av digitala verktyg, beräkningsmetoder och stora datamängder – uppstår det som numera benämns digital humaniora.
Forskningen vid Språkbanken Text kombinerar strategiskt språkteknologisk forskning med forskning inom digital humaniora och närliggande områden. Exempel på projekt är metoder för automatisk pseudonymisering; integritet, bias och rättvisa i AI; automatisk upptäckt av lexikal semantisk förändring; AI-baserad identifiering av språkliga biomarkörer för tidig kognitiv nedsättning; samt automatisk analys av inlärarspråk. Läs mer under rubriken Aktuella projekt.
Forskningsinfrastruktur och verktyg
Språkteknologi är i hög grad beroende av framsteg inom maskininlärning och tillgången till storskaliga digitala datamängder inom en rad olika expertområden. Forskningen vid Språkbanken Text genererar ofta nya språkliga resurser, annoterade datamängder, modeller och verktyg som görs tillgängliga för forskare och allmänheten genom den språkteknologiska infrastruktur som förvaltas av Språkbanken Text.
På Språkbanken Texts webbplats kan du ge dig ut på ett unikt och spännande språkligt äventyr genom att söka i stora svenska textsamlingar med hjälp av verktyget Korp, i svenska elektroniska lexikon med hjälp av verktyget Karp, samt via en rad andra plattformar.
Läs mer på Språkbanken Texts webbplats
Seminarier
Språkbankens forskningsmöten
Språkbanken Text har informella forskningsmöten de flesta torsdagar under terminstid där olika aspekter av språkteknologi och aktuell forskning i ämnet diskuteras.
AI för humaniora och humaniora för AI, HumAI
Seminarierna samordnas av Institutionen för filosofi, lingvistik och vetenskapsteori och Institutionen för svenska, flerspråkighet och språkteknologi. Syftet är att främja forskning inom språkteknologi och AI bland humanistiska forskare, men är även öppna för allmänheten. HumAI-seminarierna äger rum en gång i månaden.
Pågående projekt
Här kan du läsa om några av projekten som bedrivs vid Språkbanken Text.
AI-driven language biomarkers for early detection and progression of cognitive decline
Projektets syfte är att undersöka hur tal- och språkliga markörer kan användas för att identifiera tidiga tecken på kognitiv nedsättning och demens. Detta görs genom att integrera språkanalys med neuropsykologiska tester och biomarkörer i storskaliga kliniska dataset.
Till projektets sida (spraakbanken.gu.se)
De förslavades röster. Korpus-baserad diskursanalys av historiska slav-narrativ
Projektets syfte är att undersöka levnadsvillkoren för den förslavade befolkningen i 1800-talets Förenta stater genom storskalig analys av slavnarrativ. Med hjälp av korpuslingvistiska metoder identifieras språkliga och tematiska mönster i materialet. Projektet avser också att göra källmaterialet mer tillgängligt för vidare forskning och analys.
Till projektets sida (spraakbanken.gu.se)
HUMINFRA
HUMINFRA är en nationell distribuerad forskningsinfrastruktur för humaniora, konst och samhällsvetenskap. Infrastrukturens syfte är att samla expertis, digitala resurser och avancerade metoder för att stödja tvärvetenskaplig, kvantitativ och e-vetenskaplig forskning. Den ska också öka tillgängligheten till verktyg, data och utbildning. Exempel på metoder är ögonrörelsemätning, tangentbordloggning, 3D-teknik, AI-baserad bildanalys och kombinationer av historiska kartor och registerdata.
Till projektets sida (spraakbanken.gu.se)
Mapping Social Stratification in the Making of Modern Argentina, 1850–1900: a Micro-Level Analysis
Projektet undersöker ursprunget till social stratifiering i Argentina 1850–1900 genom digitalisering och analys av historiskt individdata. Med avancerad OCR-teknik studeras yrke, kön, läskunnighet och social rörlighet för att belysa ojämlikhetens historiska rötter och den så kallade argentinska paradoxen.
Till projektets sida (spraakbanken.gu.se)
Mormor Karl är 27 år
Projektet undersöker pseudonymisering av textuell forskningsdata för att möjliggöra säker vidareanvändning av känsligt material. Genom samverkan mellan språkteknologi, datavetenskap, dataintegritet och lingvistik studeras hur personlig information kan skyddas utan att forskningens kvalitet och användbarhet försämras.
Till projektets sida (mormor-karl.github.io)
Svenska Akademiens samtidsordböcker
Språkbanken Text förvaltar och vidareutvecklar Svenska Akademiens lexikala databas (Salex) samt arbetet med ordböckerna SAOL och SO. I samarbete med Svenska Akademien utvecklas digitala språkresurser som gör svenskans ord, betydelser och användning tillgängliga för forskning och allmänhet.
Till projektets sida (spraakbanken.gu.se)
Change is Key!
Change is Key! är ett forskningsprogram som utvecklar digitala metoder för att undersöka hur språk, samhälle och kultur förändras över tid. Genom analys av stora textmängder och tvärvetenskapliga samarbeten synliggör projektet hur ord, idéer och samhällsfrågor förändras i både historiska och nutida sammanhang.