Bild
KVAH
Länkstig

1700-talets vetenskapliga språk undersöks

Publicerad

Flera hundra år gamla vetenskapliga texter görs tillgängliga när Kungliga vetenskapsakademiens handlingar digitaliseras. Det öppnar upp för forskning kring hur akademiska texter skrevs och vilket ordförråd som använts från 1700-talet fram till våra dagar.

Vetenskapsakademiens Handlingar var en vetenskaplig tidskrift som började ges ut år 1739 med syftet att föra ut praktisk och ekonomisk kunskap på svenska, för att nå ut till fler i en tid då latin var det dominerande språket inom vetenskapen. Tidskriften innehöll alltifrån nya vetenskapliga rön till praktiska råd kring jordbruk, hantverk och industri.

– Någon skriver om en konstig sjukdom och någon om gruvdriften och arbetsförhållandena där. Det ger en bild av hur man levde på den här tiden, säger Sofie Johansson. Hon är språkteknolog och forskare i flerspråkighet vid Institutionen för svenska, flerspråkighet och språkteknologi vid Göteborgs universitet.

– Jag har i många år försökt få till stånd en digitalisering av det här materialet, men det har varit svårt. Jag har fått skriva ner uppskattningsvis 120 000 ord för hand, säger Lena Rogström, som är verksam som språkhistoriker vid samma institution och har ett stort intresse för lexikografihistoria, entomologi och 1700-talsspråk.

Digitala verktyg för textigenkänning

Universitetsbiblioteket har försökt hjälpa till med OCR-skanning (optical character reading, ett slags automatisk inläsning) men det blev inte tillräckligt bra kvalitet. Från olika håll hörde de talas om Transkribus som är ett verktyg för textigenkänning. I samband med detta utlyste Centrum för digital humaniora projektmedel vilket de sökte och fick.
– Vi började testa Transkribus och det fungerade väldigt bra. Programmet transkriberar texterna och sedan får man gå in och rätta det som blivit fel, säger Sofie Johansson.

Transkribus fungerade bra även på frakturstil som kan vara svår att avkoda för både människor och maskiner. Och ju längre fram i tiden man kommer desto snabbare gick det. Nu har forskarduon hunnit digitalisera omkring en halv miljon ord ur åtta volymer.

– Vi insåg från början att vi inte hinner göra allt, säger Lena Rogström. Men vi är en bra bit på väg.

Stora variationer i akademiskt språk

Sofie Johansson har även hunnit analysera en del texter med hjälp av andra textanalysverktyg. Det handlar om vilka ord som användes i texterna. Forskningsämnet entomologi (vetenskapen om insekter) hade fler olika ord än till exempel åkerbruk.

– Men entomologi är en nyare vetenskap och ordförrådet hade inte stabiliserats ännu. Det akademiska språket varierar mycket mellan 1700- och 1800-tal. Det moderna ordförrådet blir mer och mer likt vårt över tid, säger Sofie Johansson.

– Vi hade sett ännu mer likheter om stavningen var normaliserad. Många ord, till exempel det lilla ”och” stavades på flera olika sätt och då delar datorn upp det utifrån hur de stavas även om det är ”samma” ord, säger Lena Rogström.

– Man ser också begreppens framväxt i materialet. Någon har undersökt hur vatten expanderar när det fryser, men pratar inte om att det fryser utan går från flytande till fast, säger Sofie Johansson.

Något annat som intresserade forskarna var upptäckten att skribenterna var väldigt insatta i andras arbete. Det var – tvärtemot vad man kanske kan tro – stor omsättning på material, det fanns gott om vetenskapliga tidskrifter och postgången var effektiv.

Sällsynta texter av Linné

En författare som förekommer bland texterna Carl von Linné.
– Han är en av våra största naturvetare men några omfattande språkliga studier om hans ordförråd finns inte. Han skrev inte så mycket på svenska utan mest latin men i Kungliga vetenskapsakademiens handlingar är allt på svenska och det ger en bild av hur han skrev i förhållande till andra, säger Lena Rogström.

Deras projekt har fått mycket positiv respons, bland annat från Svenska Akademiens ordbok, SAOB. Svenska Akademien kommer också att stötta projektet med att märka upp handlingarna med författare, ämne och årtal för att de sedan ska kunna tillgängliggöras och bli sökbara för andra forskare och en intresserad allmänhet.

– Det var väldigt inspirerade att läsa de presidietal som forskare höll om varför man ska hålla på med vetenskap och varför man ska sprida den, säger Sofie Johansson.

Text: Katarina Wignell
Foto: Kungliga Vetenskapsakademiens Handlingar

 

Projektmedel från CDH

För att stimulera forskning inom digital humaniora vid Humanistiska fakulteten utlyste Centrum för digital humaniora forskningsmedel under 2021. Två projekt beviljades medel och anslagen motsvarande cirka tre månaders heltidsforskning. Utlysningen riktade sig till forskare vid Humanistiska fakulteten vid Göteborgs universitet.