Bild
illustration av data
Foto: Pixabay
Länkstig

HumAI: Är mer data alltid bättre? Korpusar, big data och AI i språkstudier

Kultur & språk
Naturvetenskap & IT

Välkommen till gästföreläsningen i HumAI:s seminarieserie: Is more data always better? Corpora, big data, and AI for the study of language. Denna gång välkomnar vi Evie Coussé, forskare på Institutionen för språk och litteraturer på Humanisten.

Föreläsning
Datum
19 mars 2026
Tid
15:00 - 17:00
Plats
sal J222 Jubileumssalen, Humanisten Renströmsgatan 6

Bra att veta
Ingen föranmälan, välkommen!
Arrangör
Språkbanken Text, Institutionen för svenska, flerspråkighet och språkteknologi; Institutionen för filosofi, lingvistik och vetenskapsteori; Institutionen för historiska studier; och GRIDH, Institutionen för litteratur, idéhistoria och religion
Bild
Evie Coussé, forskare på Institutionen för språk och litteraturer på Humanisten.
Evie Coussé, forskare på Institutionen för språk och litteraturer på Humanisten.
Foto: Foto: Janna Roosch

Föredraget hålls på engelska. För mer detaljerad information, se den engelska sidversionen. Varmt välkommen!

Om föredraget

Under de senaste decennierna har lingvistiken i allt större utsträckning förlitat sig på korpusar för att studera språk. I takt med att fler texter blivit digitalt tillgängliga har korpusarnas storlek ökat dramatiskt, och dataset som innehåller miljarder ord är numera vanliga. Sådana big‑data‑resurser gör det möjligt för lingvister att undersöka sällsynta fenomen som bara framträder i mycket stora datamängder, och att studera flera fenomen samtidigt. Detta öppnar nya perspektiv på hur språksystemet fungerar som helhet.

Detta överflöd av data skapar dock också metodologiska utmaningar: att annotera och analysera dataset av denna omfattning hamnar snabbt bortom vad mänskliga annotatörer kan hantera. Artificiell intelligens har därför utforskats som en lösning. I denna presentation illustrerar jag hur korpuslingvistiken utvecklats mot big data och AI, med exempel från min forskning om nederländska och svenska. Jag tar också ett steg tillbaka för att överväga om utvecklingen mot allt större dataset alltid är nödvändig — eller ens önskvärd — inom språklig forskning.

Germanska språk

Evie Coussé är lingvist med specialisering inom de germanska språken. Hon disputerade i lingvistik vid Ghent University (Belgien) 2008. Sedan 2010 är hon anställd vid Göteborgs universitet, där hon blev docent i lingvistik 2014. Hennes forskning fokuserar på grammatiska förändringar i de germanska språken—särskilt nederländska och svenska—including ordföljdsförändringar och utvecklingen av hjälpverb (grammatikalisering). Hon studerar dessa processer i ett brett urval av korpusar, från medeltida bibelöversättningar till moderna sociala medier.