Om en kommande bok om Digarvprogrammet
Tillsammans med min kollega professor Anna Näslund har vi börjat arbetet med att sammanställa en bok av alla de fjorton forskningsprojekt som har ingått i Vetenskapsrådets Digarvprogram. Kapitlen håller nu på att redigeras, och boken kommer att publiceras till hösten av Makadam förlag. Jag har också skrivit klart ett kapitel som behandlar det projekt som jag själv ansvarat för, Välfärdsstaten analyserad – där anslaget lyder som följer:
Våren 1950 ägde en av de första större debatterna om välfärdsstatens idé rum i riksdagens andra kammare. Diskussionen föranleddes av ett längre utrikespolitiskt inlägg från Östen Undén, socialdemokratisk utrikesminister sedan andra världskrigets slut. Även om fem år förflutit sedan det fasansfulla kriget upphörde var det ännu inte riktigt fred i Europa, tillstod Undén. ”Uppdelningen av Tyskland i en väst-zon och en öst-zon synes för närvarande konsolideras genom ockupationsländernas politik.” Sverige skulle fortsatt vara neutralt i det kalla krig som höll på att ta form, men också visa på ett slags tredje väg, menade utrikesministern, mellan det kapitalistiska väst och det kommunistiska öst. Det handlade om att tankemässigt realisera, men också praktiskt genomföra idén om den socialdemokratiska välfärdsstaten. Den skulle förstås främst gagna landets medborgare, påpekade Undén, men samtidigt lyfta fram Sverige som ett internationellt föredöme. Ministern var anspråksfull, och fick snabbt svar på tal. I ett polemiskt genmäle menade liberalen Bertil Ohlin att det var naivt att tro ”att den svenska s. k. välfärdsstaten skulle påverka uppfattningen i [kommunistiska] länder”. Att ett svenskt reformarbete skulle kunna göra intryck på nationer som numera styrdes av stalinistiska trossatser var blåögt. Högerpartiets ordförande Jarl Hjalmarsson kunde inte annat än instämma. ”Den stora meningsbrytningen i världen går inte mellan kapitalism och socialism utan mellan demokrati och diktatur.” Människor i den demokratiska världen fruktar inte varandra, fortsatte Hjalmarsson. ”Vad de bäva för är risken att tvingas in under en regim, som berövar dem alla de värden som ge livet mening för en västerlänning.” Med emfas underströk högerledaren att det därför fanns all ”anledning att varna för förhoppningen att Sverige genom att realisera ’välfärdsstatens idé’ skulle kunna påverka uppfattningen i länder med ’proletariatets diktatur’”.
Riksdagsprotokollet från denna debatt, AK 1950:11, finns sedan något decennium tillbaka tillgängligt i digital form på riksdagen.se – både som pdf-dokument och html-länk. Det är också möjligt att göra fritextsökningar på riksdagen.se i alla sådana digitaliserade protokoll, även om kvaliteten på optical character recognition (OCR) varierar. När Riksdagsförvaltningen först började att digitalisera dokument från enkammarriksdagen (protokoll, motioner, utskottsutlåtanden, propositioner etcetera) så var OCR-tolkningen inte den bästa. I ett senare samarbete med Kungliga biblioteket (KB) digitaliserades också det mesta av det äldsta riksdagstrycket, både från ståndsriksdagen (1521–1866) och från tvåkammarriksdagen (1867–1970), ett omfattande textmaterial som gjordes öppet tillgängligt på webben 2018 – med avsevärt förbättrad OCR-tolkning. Att Undén, Ohlin och Hjalmarsson debatterade utrikespolitik och den svenska välfärdsstatens idé våren 1950 har historiker alltså tämligen enkelt kunna söka fram sedan ett antal år tillbaka. Däremot har det varit betydligt svårare att jämföra och studera debatter i riksdagen om ett tema (såsom välfärdsstatens idé) över en längre tidsperiod. Men i den nya webbapplikationen riksdagsdebatter.se kan man sedan ett år tillbaka göra just det. Söker man på termen välfärdsstat så klustrar sig träffarna först kring 1927 – men då hade begreppet en annorlunda innebörd: ”den polisstyrda sociala välfärdsstaten”, menade då högermannen Otto Järte var en styggelse. Först i vårdebatten 1950 diskuterades konturerna av det som senare skulle karakterisera detta begrepp, nämligen en nationalstat (med socialdemokratiska förtecken) där det offentliga ansvaret för medborgarnas välfärd var synnerligen omfattande. Tanken med applikationen riksdagsdebatter.se har varit att göra det lättare att utforska, läsa och ladda ner anföranden av svenska riksdagsledamöter som talat i riksdagen sedan tvåkammarriksdagens införande. Applikationen baserar sig på cirka artontusen digitaliserade riksdagsprotokoll från 1867 till idag. Eftersom ett protokoll av en riksdagsdebatt inte sällan kunde sträcka sig över mer än hundra sidor så handlar det om ett mycket omfattande textkorpus.
Applikationen riksdagsdebatter.se har utvecklats vid det digitala humanioracentrat Humlab på Umeå universitet, där en utgångspunkt varit forskningsprojektet Välfärdsstaten analyserad. Arbetet handlade i en första fas om att tillföra metadata till alla riksdagsprotokoll. Det innebar dels att länka samman vem som yttrade vad (och när) i kamrarnas debatter, dels att addera information om riksdagsledamöter såsom kön, levnadsår och partitillhörighet. Det kan förefalla som en rudimentär uppgift. Men eftersom det suttit tusentals ledamöter i riksdagen, som gärna talat ofta och länge i tiotusentals debatter, så har forskningsprojektet utfört ett ansenligt arbete med att strukturera denna data. De initialt digitaliserade protokollen från Riksdagsförvaltningen och KB innehåller nämligen bara ostrukturerad data; i dessa kunde man till exempel inte söka fram alla yttranden om välfärdsstaten av Östen Undén, eller av någon annan socialdemokratisk ledamot för den delen. Strukturerad data innebär information som är organiserad på ett specifikt sätt, så att den enkelt kan bearbetas av annan mjukvara. Sådana data är vanligtvis lagrad i tabeller, där varje dataelement följer ett förutbestämt format eller struktur, såsom rader och kolumner i en csv-fil (i exempelvis Microsoft Excel). I korthet har strukturerad data inneburit att Undéns, Ohlins och Hjalmarssons anföranden i debatten 1950 separerades från varandra, att det tydligt gick att urskilja vem som sagt vad (och i vilken ordning), när yttrandet ägde rum, när det började och slutade, samt vem talaren var.
Det här kapitlet handlar om vårt arbete inom forskningsprojektet, Välfärdsstaten analyserad: Textanalys och modellering av svensk politik, media och kultur, 1945–1989. Fokus ligger på samarbetet mellan forskare och kulturarvssektor, mellan akademiker och utvecklare, samt inte minst mellan vetenskapliga ideal och krass forskningspraktik. Tanken är att beskriva vad projektet ägnat sig åt, och resonera om de erfarenheter och utmaningar som det gav upphov till, både forsknings- och digitaliseringsmässigt. Som titeln på kapitlet antyder så har det varit ett både lyckat och delvis misslyckat forskningsprojekt. Och apropå kapitlets anslag så var det också ett digitalhistoriskt forskningsprojekt som ägnat mycket tid och kraft åt att strukturera data, framför allt riksdagsprotokoll. Välfärdsstaten analyserad kan bäst beskrivas som ett projekt i skärningspunkten mellan mediehistoria och digital humaniora – med ett tredelat syfte: att digitalisera äldre textmaterial, att kurera sådan text och omforma den till strukturerade dataset, samt att bedriva forskning på dessa dataset med hjälp av olika slags digitala metoder. Metodmässigt har projektet under flera års tid arbetat med en rad typer av algoritmisk textanalys, med utgångspunkt i storskalig empiri från politikens sfär ( statliga offentliga utredningar och riksdagstryck), dagspress och skönlitteratur. I det senare fallet har alla svenska romaner utgivna mellan åren 1940 till 1965 digitaliserats – cirka tretusen stycken – liksom alla nummer av tidskriften Bonniers litterära magasin. All digitalisering har genomförts tillsammans med KB, och projektet har också återkommande samarbetat med nationalbibliotekets datalaboratorium KB-labb. Svensk efterkrigstid är en väl utforskad period, men genom att applicera digitala metoder på kurerade dataset var projektets grundtanke att granska politikens, nyhetsmediernas och kulturens sfärer på nytt. Välfärdsstaten analyserad har varit ett av de större projekten inom Digarvprogrammet; budgeten uppgick till nästan 23 miljoner kronor. Projektet har involverat ett tjugotal medarbetare vid en rad olika lärosäten. Forskarna inom projektet har främst varit medie- och litteraturvetare, men också statistiker med expertis inom maskininlärning och probabilistiska modeller för textanalys. Utvecklare vid Humlab har därtill varit centrala för att ta fram verktyg och applikationer för storskalig textanalys.