Bild
Fotografi av polisprotokoll
Foto: Stefan Jensen
Länkstig

AI och medborgarforskning skapar nya förutsättningar att studera Göteborgs historia

Är du nyfiken på Göteborgs dolda historia under slutet av 1800-talet, med allt från lösdrivare och överförfriskade sjömän till stulna fioler och borttappade emigrantkoffertar? Tusentals handskrivna sidor av polisrapporter har transkriberats med hjälp av AI och görs från och med 1 februari fritt tillgängliga digitalt.

Nu lanseras de första resultaten från ett projekt vid Riksarkivet i Göteborg i samarbete med GPS400: Centrum för samverkande visuell forskning vid Göteborgs universitet, som arbetar för att tillgängliggöra arkivmaterial på helt nya sätt – både för allmänheten och för forskare.

Projektet skapar nya förutsättningar att forska om Göteborgs historia under en period som präglades starkt av urbanisering, industrialisering och migration. Det bygger på avancerad AI-teknik och kunskap från kunniga frivilliga deltagare från allmänheten.

Ny teknik för tillgängliga arkiv

De senaste åren har forskningen tagit stora steg när det gäller automatisk transkribering av äldre handskriven text. Detta möjliggörs genom en form av artificiell intelligens där ett datorprogram tränas upp för att förstå hur det ska tolka figurer i en bild och översätta dem till tecken.

Transkriberade arkiv skapar nya sätt att söka och använda information. Skillnaden är stor jämfört med att på traditionellt sätt söka sig fram till önskade uppgifter i arkiv, vilket ofta är tidskrävande. Med en fullt transkriberad svit går det istället att fritextsöka efter information - en dröm för många arkivanvändare!

Detektiva avdelningen

Det första arkivmaterialet som Riksarkivet bearbetar med automatisk transkribering är polisrapporter från Göteborgs poliskammares detektiva avdelning 1868–1902, som omfattar cirka 22 500 sidor. Under denna period mer än fördubblas Göteborgs befolkning och drygt en halv miljon emigranter passerar staden.

Den detektiva avdelningen inrättades på 1850-talet och hade till uppgift att genomföra utredningar som ouniformerade poliser. Från och med 1868 fick avdelningen en fast personalgrupp och då började man föra så kallade “Rapportböcker” som innehåller kopior av alla utgående rapporter från avdelningen.

Innehållet i rapportböckerna har stor potential för såväl lokal- och personhistorisk forskning som akademisk forskning. Resultatet av projektet kommer att tillgängliggöras fritt för alla att ta del av via Riksarkivets hemsida och beforskas vid GPS400.

– Vi ser det här som ett första viktigt steg. Vi vill hitta nya sätt att med hjälp av digital teknik analysera historiskt arkivmaterial, och nu har intressanta data tillgängliggjorts som kan undersökas på många olika sätt, säger Mats Jönsson som är föreståndare för Göteborgs universitets Centrum för samverkande visuell forskning (GPS400).

Medborgarforskning med deltagande från allmänheten

Med hjälp av kunniga deltagare från allmänheten har datorprogrammet tränats upp för att nu klara att transkribera rapportböckerna med 97 procents korrekthet. För att den transkriberade datan ska få så hög kvalitet som möjligt fortsätter deltagarna nu med nästa steg i processen - att rätta de få fel som finns i den automatiska transkriberingen.

– Jag kan inte nog lovorda alla personer från allmänheten som bidragit till projektets förverkligande och vi vill hitta sätt att även fortsättningsvis samverka med dem i projektet, säger Mats Jönsson.

De första fem (av 36) rapportböckerna är från den 1 februari 2021 via riksarkivets hemsida. Därefter kommer ytterligare information att successivt läggas till under året.

I projektet samarbetar Riksarkivet med deltagare från allmänheten och GPS400: Centrum för samverkande visuell forskning vid Göteborgs universitet, samt med stöd av Sveriges innovationsmyndighet Vinnova.

Länkar:

De fem första rapportböckerna kan nås via Riksarkivets webbplats: https://sok.riksarkivet.se/htr

Läs mer om projektet på Riksarkrivets webbplats: https://www.riksarkivet.se/htr

Läs mer om GPS400: Centrum för samverkande visuell forskning: https://www.gu.se/centrum-samverkande-visuell-forskning

Lyssna på: Ny teknik transkriberar handskrivna dokument - P1 Släktband P1, 2021-01-29 

Se även: https://innovationsveckan.nu/program/fran-handskrift-till-maskinlasbara-data-om-tillampningar-av-handwritten-text-recognition-pa-riksarkivet/

Kontakt:

Mats Jönsson, GPS400, e-post: mats.jonsson@gu.se

Karl-Magnus Johansson, Riksarkivet, e-post: Karl-Magnus.Johansson@riksarkivet.se