Länkstig

Språkteknologisk analys avslöjar partiernas favoritord

Publicerad

Hur enkla är partiernas valmanifest att ta till sig, rent språkligt, när det kommer till bland annat läsbarhet? Språkbanken Text har gjort en språkteknologisk snabbanalys som också visar vilka värdeladdade ord som förekommer mest på vänster- respektive högersidan.

Språkteknologiska verktyg kan ge en inblick i texter, även om såväl tiden som textmängden är begränsad. Stian Rødven-Eide, doktorand vid Institutionen för svenska, flerspråkighet och språkteknologi och verksam vid Språkbanken Text, har gjort en snabbanalys av alla partiers valmanifest 2022.

– Det första vi gjorde var att köra dokumenten genom Språkbankens annotationsverktyg Sparv. Det gav oss bland annat läsbarhetsvärden och attitydanalys.

Genomsnittslängden på manifesten är ca 6 000 ord, men varierar en hel del, från Kristdemokraternas 1 623 ord till Moderaternas 11 139.

Moderaternas och KD:s valmanifest mest svårlästa

LIX, som står för läsbarhetsindex, är en indikation på hur svårläst en text är utifrån meningslängd och antalet långa ord (med fler än sex bokstäver). Värdet varierar normalt mellan 20 (lättläst) och 60 (svårläst). En analys av läsbarhetsindex (LIX) visade att Moderaternas manifest var mest svårläst, med ett läsbarhetsindex på 52,67. Mest lättläst enligt LIX-analysen var Liberalernas valmanifest, med ett läsbarhetsindex på 41,62.

Tittar man på NK som står för nominalkvot och berättar hur informationstät en text är (vilket också kan innebära att den är mer svårläst) så är det Kristdemokraternas som är mest informationstät och Liberalernas som är minst informationstät.

Värdeladdade ord

Stian Rødven-Eide har även tittat på antalet värdeladdade ord i valmanifesten, det vill säga andel ord som är positivt respektive negativt värdeladdade enligt Språkbankens sentimentlexikon.

– Där ser vi att Centerpartiet och Miljöpartiet uttrycker sig mer positivt än övriga partier, med fraser som ”en ljusare framtid är möjlig” och ”solidaritet med kommande generationer”.

På den negativa sidan av sentimentanalysen är det Sverigedemokraterna som sticker ut, med M och S sida vid sida strax därefter. I deras manifest dominerar ord som ”kriminalitet” och ”våld”.

– Här ser vi tydligt ett fokus på brott och straff, vilket ju har varit ett av de stora debattämnena under den här valkampanjen.

Under undersökningens gång togs det även fram ord som är unika för varje parti, men det blev för många ord för att enkelt kunna säga något meningsfullt om dem. Däremot gick det att se närmare på vilka ord som var unika för de båda blocken. Det vill säga ord som användes av alla partier i ett block, men inte användes alls av något av de andra partierna.

Hos MP+S+V (och inga andra) hittades orden alliansfrihet, flykt, fred, klyftor, semester, sjukförsäkring och skolbibliotek. Om C läggs till i den gruppen får vi istället orden klimatförändring, klimatsmart och solidaritet.

Unika ord för gruppen M+L+KD+SD var dom, frigivning och fängelse. Om C istället läggs ihop med högerblocket ger det orden sexualbrott, tuff och utanförskap.

Läs mer om snabbanalysen av valmanifesten på Språkbanken Texts blogg.

Kontakt:
Stian Rødven-Eide, tel: 031-786 1083, e-post: stian.rodven.eide@svenska.gu.se

Läsbarhets- och attitydanalys av riksdagspartiernas valmanifest

Antal ord: C 8.515, KD 1.623, L 7.364, M 11.139, MP 3.677, S 4.545, SD 3.332, V 7.824

LIX: C 46,09, KD 44,26, L 41,62, M 52,67, MP 42,77, S 44,92, SD 49,68, V 46,95

NK: C 1,38, KD 1,45, L 1,27, M 1,40, MP 1,41, S 1,34, SD 1,39, V 1,28

OVIX: C 63,23, KD 74,47, L 67,26, M 68,86, MP 69,19, S 68,30, SD 72,03, V 65,45

POS: C 8,2%, KD 7,3%, L 5,9%, M 6,0%, MP 8,0%, S 7,3%, SD 6,1%, V 6,6%

NEG: C 2.0%, KD 3.3%, L 3,0%, M 3,8%, MP 3.2%, S 3,8%, SD 4,4%, V 3,3%

LIX = läsbarhetsindex: En indikation på hur svårläst en text är utifrån meningslängd och antalet långa ord (fler än sex bokstäver). Värdet får man genom att dela antal ordantal meningar, och lägga till antal långa ord delat på totala antalet ord. LIX varierar normalt mellan 20 (lättläst) och 60 (svårläst).

NK = nominalkvot: Säger hur informationstät en text är. Ett högt värde tyder på en informationstät text, vilket också kan innebära att den är mer svårläst. För att räkna ut nominalkvot lägger man ihop antalet particip, substantiv och prepositioner och delar detta på antalet verb, adverb och pronomen.

OVIX = ordvariationsindex: Texter med ett stort antal engångsord, det vill säga ord som används endast en gång, får ett högt OVIX-värde. Värdet får man genom att dela antalet unika ord på det totala antalet ord i texten.

POS: Andel ord som är positivt laddade enligt Språkbankens sentimentlexikon.

NEG: Andel ord som är negativt laddade enligt Språkbankens sentimentlexikon.