Digitalisering av svenska romaner

Inom ramen för vårt nya VR-projekt “Välfärdsstaten analyserad. Textanalys och modellering av svensk politik, media och kultur, 1945-1989” har det på sistone gjorts en hel del intervjuer med mig. De flesta har kretsat kring hur och på vilket sätt vi tänker oss att digitalisera alla svenska romaner från 1945 till 1989. Vi har alltså erhållit medel för att digitalisera dessa böcker så att maskiner kan läsa dem – inte människor. Hur de upphovsrättsliga frågorna ska lösas för att ge allmän tillgång till alla romaner ligger utanför projektets ramverk, även om jag själv kommer att försöka att driva denna fråga också. Biblioteksbladet har skrivit om frågan i artikeln 22 000 svenska romaner digitaliseras och sajten Boktugg i artikeln Det fria digitaliserade litteraturarvets olösliga ekvation.

Anteckningar om kommande bok kring de svenska minnesinstitutionernas mediehistoria

Inom ramen för forskningsverksamheten i projektet Digitala modeller har jag påbörjat arbetet med ett bokmanuskript kring de svenska minnesinstitutionernas mediehistoria. Jag tänker mig en översiktlig studie med start i den Kungliga modellkammaren kring 1750 och med slutpunkt i de senaste decenniets digitaliseringsverksamhet. I mediehistorien uppmärksammas mycket sällan det omfattande mediebruk och den diversifierade medieanvändning som präglat de institutioner som haft till uppdrag att bevara kulturarvet. Objekt ur samtiden eller det förflutna har modellerats, katalogiserats, fotograferats, filmatiserats och numera digitaliserats. Tanken med denna bok är att fylla en betydande kunskapslucka och genom ett antal fallstudier behandla ABM-sektorns medieanvändning. Olika slags medier har naturligtvis samlats in och bevarats på svenska minnesinstitutioner, och boken är tänkt att både se närmare på hur medier sparats – men också hur dokumentation inom kulturarvssektorn tagit sig olika mediala utryck, från katalogposter över fotografering av samlingar till mikrofilm, hålkort och dagens digitalisering. Här ligger fokus på hur sådana medieformer reglerat det innehåll som skulle bevaras och därigenom påverkat synen på samlingarna. Mediebruket på landets minnesinstitutioner har nämligen inte sällan varit instrumentellt; det har handlat om att dokumentera begivenheter på nya sätt men också att representera kulturarv för forskare, besökare och kommande generationer. Hur och på vilka sätt som medier använts har därtill växlat över tid; problematiken handlar om värderingar från en tid till en annan, teknikskiften och prioriteringar i ofta hårt trängda verksamheter. Vad som intresserar mig är bland annat hur fotograferingsmediet användes på Nationalmuseum, hur Nordiska museets folklivsfilm etablerades, vilka fonograinspelningar som utfördes på Etnografiska museet, hur så kallade “moderna arkivmedier” började att användes under efterkrigstiden – det vill säga, databärare som hålkort, mikrofilm och magnetband som bland annat Dataarkiveringskommittén studerade mellan 1968 och 1977 – till de senaste årtiondenas digitaliseringsarbete. Arbetstiteln på boken är, Dokumentation & representation. De svenska minnesinstitutionernas mediehistoria 1750-2015 – och jag tänker mig sju huvudkapitel i en kronologi med överlappande mediehistorier: Kapitel 1. Modeller (1750-1850), Kapitel 2. Kataloger (1800-talet), Kapitel 3. Fotografi (1880-1920), Kapitel 4. Ljud (1910-1960), Kapitel 5. Film (1910-1960), Kapitel 6. Moderna arkivmedier (1960-80) och Kapitel 7. Digitalt kulturarv (2000-2015). I korthet kommer boken att med utgångspunkt i samtida digitaliseringsaktiviteter histiorisera de olika sätt som kulturarvet tidigare både dokumenterats och representerats på. Förhoppningen är att vara klar med ett manuskript i början av hösten 2019.

Om en kommande bok kring projektet Digitala modeller

I dagarna håller jag på att sammanställa ett bokmanuskript kring forskningsprojektet Digitala modeller på Tekniska museet. Jag är redaktör tillsammans med projektets forskningskoordinator Jenny Attemark-Gillgren. Det kommer att bli en rikt illustrerad bok som publiceras i bokserien Mediehistoriskt arkiv med sammanlagt åtta kapitel. Boken kommer att vara klar i slutet av januari nästa år. Mitt eget bidrag – skrivet tillsammans med teknikhistorikern Anders Houltz – har titeln “Modellers biografiska liv. Om Tekniska museet och det mekaniska alfabetet” och handlar om Polhems små trämodeller under 300 år. Kapitlet är indelat i fyra separata men sammanhängande delar, en sorts materiella berättelser som tar avstamp i lika många historiskt skiftande kontexter – Carl Johan Cronstedts skissbok från 1729, trämodellernas funktion på Teknologiska Institutet under 1800-talet, Torsten Althins vurm för och institutionella användandet av det mekaniska alfabetet under 1920- och 30-talet, samt trämodellernas utställningssammanhang på Tekniska museet efter andra världskriget. Del 4 av kapitlet inleds på följande sätt:

I slutet av maj 1947 invigdes utställningen ”Kongl. Modellkammaren” på Tekniska museet. I mer än tjugo år hade museidirektören Torsten Althin väntat på att få visa upp och göra en ordentlig utställning om Polhems små trämodeller vilka museet idogt reparerat sedan 1930-talets början. Invigningen lät tala om sig; ”Tekniska samlingar i 8 000 delar” påtalade till exempel Svenska Dagbladet på sin förstasida. ”Christopher Polhems skapelse rymmande världens … säkerligen äldsta tekniska samlingar” kunde nu äntligen ses på Tekniska museet. Där hade man ”arbetat med att sätta ihop [alla] de 350 modellernas c:a 8 000 smådelar, och det glänsande resultatet – som saknar motstycke i något museum – visas nu i den nya Polhemssalen.” Althin, som både skrivit, föreläst och talat i radio om denna samling – i princip var det ju han som genom sin mediala verksamhet (och pressutskick) vältaligt argumenterat för samlingens unika status – lyckades ånyo med att skapa uppmärksamhet. 300 personer var närvarande vid invigningen, inklusive prins Bertil, och det rapporterades om utställningen i ett tiotal olika dagstidningar. ”Polhems märkliga modeller samlade i Tekniska museet. 250 år sedan hans Kongl. Modellkammares tillkomst” var Tidningarnas Telegrambyrås rubrik som flitigt plockades upp i landsortspressen. Uppmärksamheten höll i sig – i juli samma år fyllde Althin lägligt nog 50 år – och bland annat Röster i Radio gjorde några månader senare ett stort bildreportage om Polhem och hans modeller, där det påpekades att samtliga ”återgivna modeller finns på Tekniska museet i Stockholm”.

I inbjudan till utställningen 1947 från museets styrelse (”klädsel, kavaj”) framgick därtill att Althin under invigningen höll ett föredrag vars titel lika påpassligt som oblygt, pekade på det 250-årsjubileum som länkade samman den nya utställningen, Tekniska museet och Polhem: ”Från Polhems Laboratorium Mechanicum 1697 till Tekniska museet 1947, anförande av Intendent Torsten Althin”. [illustration utställning 1947] Hans ”kåserande föredrag” var uppskattat, åtminstone om man ska tro pressklippen, men dessvärre har det inte bevarats.

Historien om hur Polhems mekaniska alfabet började att ställas ut på Tekniska museet i funkisbyggnaden på Gärdet i Stockholm – ritad av arkitekt Ragnar Hjort och invigd 1936 – har emellertid fler komponenter än vad Althin lät påskina i sina olika uttalanden 1947. I museets ämbetsarkiv finns exempelvis två små bilder från september 1942, fotograferade i vad som redan då kallade ”Polhemssalen”, vilka visar att ett flertal reparerade modeller från den Kungliga modellkammaren mer eller mindre permanent ställdes ut på museet redan i början av 1940-talet (och kanske till och med tidigare än så). Dels var Polhemssalen alltså allt annat än ”ny” 1947, dels hade utställningen med modellerna precis samma namn 1942 som fem år senare (”Kongl. Modellkammaren” och ”Laboratorium Mechanicum”).

Huruvida modellerna ur Polhems mekaniska alfabet var utställda i museet före 1947 är oklart. Men att Althin fortsatt och oförtrutet gjorde reklam för, proklamerade dess betydelse och i största allmänhet ägnade uppmärksamhet åt samlingen står bortom allt tvivel. Bläddrar man i arkivförteckningen för Althins personarkiv på Tekniska museet återkommer Polhem och hans betydelse ofta. 1943 listas exempelvis ”Föredrag: 228. Den svenska mekanikens fader – Christopher Polhem”. Samma år talade Althin också i skolradion om Polhem och hans ”mekaniska alfabet [vars] modeller … skulle visa, av vilka delar en maskin var sammansatt.” I publikationen Svenska Museer från 1941 påtalades vidare att Tekniska museet vid den här tidpunkten hade omkring 30 000 besökare per år, samt att museets modellverkstad ”haft full sysselsättning med byggande av modeller såväl för museets eget behov som även för andra institutioner.” Därtill framgick att museet ”liksom tidigare icke åtnjutit anslag, vare sig från stat eller kommun.”

Det senare är centralt; pengarna tröt för Althin, och man gör därför klokt i att betrakta Althins propagerande för Polhem, det mekaniska alfabetet och invigningen av utställningen ”Kongl. Modellkammaren” 1947 genom ett slags ekonomisk lins. Althin behövde uppmärksamhet (och pengar) till sitt museum. Polhems unika modeller var ett av hans främsta kort. Att han passade på att (åter)inviga ”Kongl. Modellkammaren” tillsammans med två andra, nya utställningar (”Fysikaliska experiment” och ”Mekanisk ljudåtergivning”) är därför talande. Som musei-medial strategi garanterade det uppmärksamhet från pressen, och Althin var inte sen att utnyttja den – liksom det faktum att han närmast personifierade sitt museum – i den konstanta jakten efter medel till museet. ”Intellektuellt nöjesfält” var exempelvis den slående rubriken som tidskriften Medborgaren använde när den rapporterade om invigningen 1947: ”Intendent Torsten Althin … har sitt huvud för sig, och efter sitt huvud ordnar han sitt museum [nu vill han] ha sitt museum som ett nöjesfält för intellektuella. Det låter obskyrt men är berömvärt. Han ger tekniken liv och låter besökaren vara med och leka.”
Givet den minst sagt ombytliga historien kring modellerna i det mekaniska alfabetet, så kan man förledas att tro att när denna samling (liksom övriga modeller från Kungliga modellkammaren) väl hamnade på Tekniska museet i slutet av 1920-talet, ja då kunde trämodellerna hanteras i godan ro. Men det märkliga är alltså att det tog Althin tjugo år att på allvar (och permanent) ställa ut Polhems modeller. I Daedalus årgång 1948 uppmärksammade han denna lätt besynnerliga omständighet, liksom hur han såg på modellsamlingens biografiska liv (en text som i det korta påminner om det här kapitlet).

Ända sedan Tekniska museet tog över ”vården av de illa åtgångna modellerna”, skrev Althin, var det för museet ”en angelägen sak, att modellerna skulle i en eller annan form kunna vara permanent utställda och tillgängliga för beskådande och studier.” Men även Althin var på det klara med att detta tagit osedvanligt lång tid – ”det är som om det under de gångna 250 åren vilat någon slags förbannelse över denna modellsamling”, skrev han. Därefter redogjordes för modellernas skiftande öden och äventyr; modellsamlingen som ”växte i omfattning, flyttades från det ena stället till det andra.” När museet väl fått hand ”om samlingen som torde vara en av de största i sitt slag”, trodde Althin och hans medarbetare att ”dessa oroliga tider” skulle vara förbi. Under ”en tioårsperiod” då museets personal ”systematiskt” arbetade sig igenom modellerna, och ”försiktigt reparerat och rekonstruerat” dem, var förhoppningen hela tiden att ”modellsamlingen omedelbart skulle kunna ställas ut i den stora sal som reserverats för ändamålet.” Men, påtalade Althin sinistert – ”då kom det andra världskriget.” Museets ”historiskt sett” mest dyrbara material måste nu ”packas ned, färdigt för ögonblicklig evakuering till säkrare plats om så skulle erfordras.”

1948 var de flesta klara över andra världskrigets fruktansvärda förstörelse, men Althins resonemang haltar ändå en smula. Att han efter kriget kunde sörja de modellsamlingar i Augsburg och Nürnberg som gått förlorade genom ”bombardemang från luften” är en sak, men att trettiotalet småmodeller ur det mekaniska alfabetet inte kunde förevisas på grund av ett eventuellt krigs- och bombhot mot Stockholm är lätt förbryllande – inte minst eftersom museet ägnat betydande personalresurser åt att iordningställa modellerna under så lång tid. Polhems små trämodeller packades alltså ned, men det var kvar på museet för ”ögonblicklig evakuering”. Andra modeller ur den Kungliga modellkammaren var dock utställda i Polhemssalen under kriget, men inte det mekaniska alfabetet. Man får nära nog intrycket att Althin önskade att förhöja samlingens auratiska äkthet – ”det historiskt sätt dyrbaraste materialet, som vi hade i museet från gångna tiders ingeniörskonst” – genom att gömma undan den, och samtidigt bättra på samlingens redan digra biografiska legend.

Under krigsåren var hotbilden förstås förhöjd när det gällde landets kulturarv. På Kungliga biblioteket låg verksamheten exempelvis i träda; vintern 1940 var nationalbibliotekets forskarsal till och med stängd på grund av bränslebrist. Två år senare skrev poeten Hjalmar Gullberg sitt diktverk, ”Hymn till ett evakuerat Nationalmuseum”, där flera betydande målningar gömts undan – så visst fanns det skäl till oro. Likafullt framstår Althins beslut att inte visa upp det färdigrestaurerade mekaniska alfabetet under kriget som en lätt drastisk (och möjligen överilad) åtgärd. Museet var ju knappast stängt under krigsåren, tvärtom. Fler och fler utställningar öppnade; 1941 besöktes museet av 29,717 personer, ett år senare kom 32,368 besökande – och 1943 anordnades en mycket populär utställning om ”Teknik i miniatyr” i samarbete med Dagens Nyheter och tidskriften Teknik för alla (en utställningsidé som framöver skulle återkomma).

Givet Althins stora intresse för det mekaniska alfabetet ligger det därför närmare till hands att tro att han helt enkelt ville presentera samlingen på ett så fullödigt sätt som möjligt. Det var inte möjligt under krigsåren, och följer man Althin i hans årliga redovisningar i Daedalus så var den främsta anledningen bristen på pengar – vilket han heller inte hymlade med när han skrev om planeringen och genomförandet av ”Kongl. Modellkammaren” i sin återblick i Daedalus 1948. Årsboken inleddes just under många år med en lång lista på företag som lämnat så kallat ”årsbidrag” till museet, och även om listan på företag var lång så var dessa årsbidrag åtminstone under krigsåren tämligen beskedliga, ”i regel kr. 100: –”. Därför var det först när Knut och Alice Wallenbergs stiftelse gav ”ett betydande anslag” för att ordna ”Polhemssamlingarna” som utställningen 1947 kring det mekaniska alfabetet kunde färdigställas.

Eftersom Tekniska museet inte fick något stats- eller kommunalt anslag var man alltså beroende av extern finansiering – liksom betalande besökare. Men om utställningen 1947 kring den ”Kongl. Modellkammaren” tveklöst bättrade på museets kulturella och industrihistoriska prestige så var den inte någon direkt ”publikfriande avdelning” – orden är Althins. Det berodde främst på att i denna ”avdelning få föremålen icke vidröras eller sättas i funktion”, vilket naturligtvis var lätt paradoxalt eftersom Polhems mekaniska alfabet just avsåg att praktiskt demonstrera mekaniska rörelser genom att användas. Även Stockholms-Tidningen var i sin anmälan om utställningen inne på samma tankegång. Tekniska museet var förvisso ett ”paradis för tekniskt intresserade” men den ”nyinredda ’Kongl. Modellkammaren’, en avdelning motsvarande Polhems modellkammare av 1697 – den äldsta i världen – och resultatet av ett tioårigt rekonstruktions- och forskningsarbete” var inget för ”klåfingriga” eftersom föremålen ej fick ”vidröras”.
Denna problematik kring att förevisa och ställa ut äldre pedagogiska trämodeller – som inte fick röras – skulle återkomma på Tekniska museet under femtio- och sextiotalet. Men precis efter kriget hade Althin också andra skäl till att äntligen få till stånd en permanent utställning av de restaurerade mekaniska alfabetet. I oktober 1946 hade nämligen tidskriften Teknik för alla gjort ett stort temanummer om ”Polhemsrummet” på Bergslagets museum i Falun. I ingressen framgick att tidskriften ånyo (i samarbete med Tekniska museet) skulle anordna en utställning om ”Teknik i miniatyr”, och att man i samband med denna bjudit in ”den kände modellbyggaren Olle Norelius” att presentera ett av ”vårt lands främsta samlingar av industrihistoriska och tekniska modeller, nämligen Bergslagets museum i Falun.”

Som vi påpekat tidigare i det här kapitlet var det ingen mindre än bergs- och industrihistorikern Carl Sahlin vilken som ung gruvingenjör i Falun under 1890-talet spårat upp Polhems modeller, och framöver verkat för att de skulle bevaras och så småningom ställas ut i Bergslagets museum, vilket alltsedan 1922 inrymdes i den gamla administrationsbyggnaden vid Falu gruva. Norelius påpekade i sin artikel rentav att ”de gamla Polhems-modellerna med det mekaniska alfabetet i spetsen” utgjorde själva ”grunden till museet”. För sin mekaniska undervisning tillverkade Polhem ”en serie trämodeller”, skrev Norelius, ”främst avsedda att illustrera olika metoder av kraftöverföring men också för att åskådliggöra andra mekaniska sammanhang, vilka han kallade sitt mekaniska alfabet. En betydande del av dessa modeller återfinnes i det s.k. Polhems-rummet på museet, tillsammans ett flertal utsökt vackra trämodeller, som utförts av honom personligen eller av hans medhjälpare”. Som vi tidigare skrivit var det inte Polhem utan med all sannolikhet gruvmätaren Samuel Buschenfeldt som byggt modellerna. Norelius svävade på målet, men hävdade inte desto mindre att Bergslagets museum hade flera ”originalmodeller” från Polhems mekaniska alfabet, och att ”tidigare generationer inte förstått det oerhörda värdet av dessa modeller.”

Med andra ord var det inte bara Torsten Althin som använt Polhem och det mekaniska alfabetet för att bygga en museiinstitution. Detsamma gällde i princip för Bergslagets museum, och givetvis förelåg de en viss konkurrens institutionerna emellan. Att Norelius artikel publicerades ett halvår före det att Tekniska museet invigde sin utställning om ”Kongl. Modellkammaren” är måhända en slump, men den kan också läsas i ljuset av en viss tävlan mellan muséerna i fråga. Samtidigt vittnar Althins korrespondens med Alwar Silow, som under många år var huvudbibliotekarie på Stora Kopparbergs Bergslags AB och länge ansvarig för museiverksamheten i Falun, om ett betydande gemensamt industrihistoriskt intresse, liksom om ömsesidigt förtroende och rentav vänskap.

I Althins personarkiv finns en hel mapp kring deras brevväxling (som pågick under flera decennier), därtill har vi hittat en lika betydelsefull som kort notis om ett telefonsamtal mellan Carl Sahlin och Silow i augusti 1924. I denna bevarade notis framgår att Sahlin kommit överens med Silow om hur arvet efter Polhem skulle förvaltas. Tekniska museet hade uttryckligen för ”avsikt att söka få till stånd en samling av samtliga bevarade föremål, ritningar m.m. om och av Polhem i original.” Vad som dock också framgick av notisen var Silow härvidlag ”avsagt sig anspråk på förvärv för Bergslagets museum i Falun av allt material om Polhem som icke direkt hör samman med Polhems arbeten för Stora Kopparberget och Falun.” Med andra ord ingicks redan på 1920-talet – före Althin kom in i bilden på allvar – en överenskommelse mellan Bergslagets museum och Tekniska museet hur Polhems kvarlåtenskap, material och modeller skulle delas upp. Det hindrar nu inte att Althin åren efter kriget kände sig lätt pressad av att äntligen få till stånd en ordentlig utställaning kring Polhems modeller, och att Norelius artikel i Teknik för alla möjligen påskyndade detta arbete. Samtidigt var det just Althin som grundat denna tidskrift, så säker kan man inte vara.

Mediehistoriskt VR-projekt kring storskalig textanalys

Häromdagen erhöll jag ett betydande forskningsanslag på nästan 23 miljoner från Vetenskapsrådet för ett mediehistoriskt forskningsprojekt i samarbete med Kungliga biblioteket. Projektet involverar flera forskare, utvecklare och datakuratorer. Den svenska titeln är – “Välfärdsstaten analyserad. Textanalys och modellering av svensk politik, media och kultur, 1945-1989” (akronymen är WeStAc) – och den svenska sammanfattningen lyder som nedan. Jag kommer naturligtvis att återkomma till detta femåriga projekt här på bloggen.

De svenska välfärdsåren utgör en period av förändring, med utbyggda institutioner, nya levnadsmönster och förändrade relationer till omvärlden. Inte minst 1960-talet har framhävts som decenniet då politik och kultur radikaliserades, gamla auktoriteter utmanades och nya delar av världen placerades på kartan. Men trots att perioden är väl utforskad finns det anledning att återvända till den med metoder som låter oss studera diskursiva förändringar på makronivå. Med tillgång till storskaliga digitaliserade textsamlingar från politikens, nyhetsmediernas och kulturens sfärer kan gamla frågor ställas på nytt, samtidigt som relationen mellan de olika samhällssfärerna kan utforskas i detalj.

WeStAc är ett samarbete mellan Umeå universitet och Kungliga biblioteket (KB) och har ett tvådelat syfte: att etablera system och rutiner för att digitalisera och kurera stora textmaterial som möter de krav som digital forskning ställer, samt att kartlägga diskursiva mönster i välfärdsårens texter. Ofta har massdigitalisering bedrivits utan insikter och krav från forskare som arbetar med hela textkorpusar och digitala metoder. Inte sällan har därför digitala resultat varit så bristfälliga att det varit svårt att använda i sådan forskning. WeStAc angriper detta problem genom att bedriva digitalisering och digital forskning parallellt – och i samspel med varandra. I projektet digitaliseras och kureras texter i syfte att möta forskningskraven, samtidigt som projektets empiriska forskningsdel ger kontinuerlig feedback tillbaka till de instanser som digitaliserar och iordningställer texterna som dataset.

WeStAc kommer att arbete med tre massiva dataset: “politik” – 3 100 SOUer och allt riksdagsmaterial mellan 1945 och 1989; “media” – två dagstidningar, Aftonbladet och Dagens Nyheter från samma period, och “kultur” – kulturtidskriften Bonniers Litterära Magasin (BLM) samt alla svenska romaner som publicerades under perioden. Projektet är indelat i tre arbetspaket: (WP1) digitalisering & datakurering, (WP2) textanalys & modelering samt (WP3) välfärdsstaten analyserad. I korthet utgör grundfrågorna till alla dataset om övergripande diskursiva förändringar är lika påtagliga som tidigare forskning antagit, eller om de uppvisar oväntade kontinuiteter. Finns det exempelvis kvardröjande diskurser, eller är diskursiva förändringar mer påtagliga i vissa sfärer och genrer jämfört med andra?

Texterna från Sveriges riksdag (protokoll, motioner, propositioner och offentliga utredningar) samt dagtidningsmaterialet är redan digitaliserat. Det förra består av uppskattningsvis 700 miljoner ord, det senare av omkring två miljarder ord. För att öka värdet av dessa digitala samlingar kommer de att kureras och förses med metadata på KB, bland annat för att göra det möjligt att särskilja aktörer i riksdagens debatter och märka upp enskilda delar i dagstidningarna, exempelvis kultursidorna. Detta arbete utförs parallellt med, och utifrån feedback från projektets forskningsdel. Därtill kommer WeStAc att digitalisera BLM, på omkring 28 000 sidor, samt alla på svenska publicerade romaner 1945–89, omkring 22 000 stycken vilka innehåller uppskattningsvis tre miljoner sidor. Tidskriften och romanerna utgör nya dataset, som tillsammans med riksdagsmaterialet och dagstidningarna gör det möjligt att spåra språkliga förändringar och ämnesmässiga förskjutningar över genregränserna.

De olika textsamlingarna är valda för att representera tre centrala sfärer i det svenska välfärdssamhället: politikens, mediernas och kulturens. Tre tidstypiska metatrender kommer att utforskas med den samlade textmassan som grund: globalisering, individualisering och emancipation. WeStAc kommer att använda tre metodologiska modeller för att fånga språkliga och ämnesmässiga mönster över tid: topic modeling – som utifrån samförekommande ord kan identifiera innehållsliga ämnen och diskurser samt deras utbredning, named entity recognition (NER) – som lokaliserar person-, organisation- och platsnamn i texterna, samt så kallad word embedding – som gör det möjligt att beräkna relationen mellan enskilda ord och den omgivande språkliga kontexten. Med dessa metoder kan förekomster av geografiska platser studeras över tid, liksom innehållsliga teman i politiska debatter, romaner och nyhetstexter, samt enskilda nyckelords användning och skiftande betydelser. Härutöver undersöks enskilda dataset med metodologiska modeller anpassade för specifika genrer.

Tekniska museet och det mekaniska alfabetet

Tillsammans med min kollega, teknikhistorikern Anders Houltz skriver jag för närvarande på en artikel om Tekniska museet och Christopher Polhems så kallade mekaniska alfabet. Artikeln kommer att ingå i en kommande bok som vi håller på att sammanställa kring projektet Digitala modeller. Projektet kommer också att resultera i en mindre utställning på Tekniska museet som öppnar i februari nästa år. Den liksom den kommande boken bildar ett av forskningsresultaten från vårt projekt. Anders och jag har kommit en bit på vår artikel – det kommer att bli en längre text, och anslaget ser för närvarande ut så här:

I mars 1939 höll chefen för Tekniska museet, Torsten Althin, ett föredrag i rundradion. Ämnet var ”Tekniskt-historiskt varjehanda: Mekaniska alfabetet” och handlade om de gamla trämodeller som Christopher Polhem tros var upphovsman till åren omkring 1700. Det brukar anföras att Polhems mekaniska alfabet bestod av cirka 80 små trämodeller som praktiskt illustrerade ”grundläggande maskinelement”, till exempel hävstången, hjulet eller skruven. Althin hade alltsedan han i mitten av 1920-talet började sin egentliga museibana varit mycket intresserad av dessa trämodeller; han hade skrivit och föreläst om dem i flera olika sammanhang. Under slutet av 1920-talet hade han lyckats få Kungliga Tekniska Högskolan i Stockholm att deponera ett trettiotal av modellerna till det nya Tekniska museet, och därtill övertygat svenska regeringen att anslå en betydande summa pengar för att restaurera ”Polhems originalmodeller” eftersom de utgjorde en ”enastående kulturskatt [som det] knappast finnes motstycke [till] i något annat land.”

För Althin var modellerna lika unika som användbara. Genom att publicera artiklar om dem, föreläsa i diverse sammanhang – och inte minst berätta om dem i radio – spred han information och kunskap om teknikhistoria i allmänhet och Polhems modeller i synnerhet. Althin var en folkbildare av rang, och radiomediet hade en betydande räckvidd. Han inledde därför retoriskt sitt föredrag 1939 med att påpeka att konst- och litteraturhistoria står ”på schemat vid våra läroanstalter”, men var finner man ”ämnet teknisk historia någonstans?” Teknikhistoria var visserligen ett helt nytt kunskapsfält, hävdade Althin, och ”än så länge håller man på med en första grov plöjning inom denna viktiga vetenskap.” Men teknikens historia i allmänhet, och kunskap om mekanik i synnerhet, hade betydande svenska anor – ”mekaniskt alfabet” var därför ”underrubrik för dagens kåseri”.

Programtablåer för AB Radiotjänst innehöll under 1930-talet ofta folkbildande föredrag om kulturhistoria. Genren kunde vara träig. Men den passade Althin; han var en skicklig teknikhistorisk berättare och hade föreläst i radio vid flera tillfällen – till och med om samma tema. I april 1931 hade han exempelvis berättat om ett fiktivt ”besök hos Polhem på Stjernsund 1729”. Vårvintern 1939 var fokus delvis ett annat, och Althins idé var ”att berätta om de nära nog eviga tankar och problem som ha rört sig i människornas hjärnor och som ha krävt sin tekniska lösning”.

Dessvärre har själva radioprogrammet från 1939 inte bevarats, däremot Althins manuskript i hans personarkiv på Tekniska museet. Eftersom han kunde Polhem och historien om det mekaniska alfabetet på sina fem fingrar, är det verkligt intressanta med radioföredraget 1939 hur Althin i radiostudion på ett meta-teknologiskt sätt reflekterade över Polhems trämodeller och deras pedagogiska funktion i ljuset av modern teknik och nya medier. Den ”märklige ingenjör” Polhems ”tekniska undervisning”, hävdade Althin, var ”så modernt upplagd, att vi knappast ha kommit längre … idag.” Poängen med dess modeller var att visa grundläggande maskinelement; det handlade om att åskådliggöra och visualisera mekanik och tekniska idéer genom trämodeller, ett slags kommunikativa medieformer från gångna tider.

Men att påvisa hur dessa modeller fungerade rent praktiskt var förstås inte så lätt i radio. När jag nu ”sitter här framför mikrofonen” så är det en sak som ”jag livligt saknar”, påpekade därför Althin. Det är något som ”ännu inte är teknisk färdigt i praktiken i vårt land, och det är televisionen.” Althin talade alltså om den tidigmoderna tidens kanske främsta mediala åskådningsform (modeller), i modernitetens mest framträdande och publika medieform (radio) men beklagade sig över att han inte kunde visa upp dem (i television). ”Bilder och åskådningsmaterial är ju ganska nödvändigt att kunna visa fram, när man skall tala om tekniska ting, men den dagen är kanske inte långt avlägsen, då Ni på Edra radioapparater kan få beskåda modeller och maskiner, som det talas om från studion.”


Tingens biografi – om artikeln
Om man ska tro Althin hade televisionen 1939 varit det optimala mediet för att visa upp de gamla trämodeller som tillskrivs Polhem. Tv-tekniken hade introducerats under trettiotalet framför allt i England, men också i Tyskland under de olympiska spelen i Berlin 1936. Althin var väl förtrogen med det nya bildmediet, liksom med fotografi och film. Som museiman påpekade han ofta att de ting och objekt som ställdes ut på Tekniska museet skulle levandegöras – gärna med hjälp av visuella medier som planscher, modeller eller film. Med inspiration från Nordiska museets filmverksamhet startade han till exempel tidigt produktion av teknikhistorisk film; redan 1922 höll Althin faktiskt ett föredrag om ”Filmen i kulturminnesforskningens tjänst”.

Med det var ändå (skal)modeller som utgjorde förebild för hur ett skrymmande industriarv kunde åskådliggöras. Efter att Althin ordnat medel från staten kunde det mekaniska alfabetet restaureras under 1920- och 1930-talet. Modellerna gömdes undan på säker plats under andra världskriget, och från 1947 ingick de i princip alltid i Tekniska museets basutställningar (med lite olika variationer under årens lopp). Skalan är central för att förstå varför modellerna var viktiga för Althin. Att ställa ut gamla smedjor eller valsverk på museum i skala 1:1 var praktiskt omöjligt, men modellerna i det mekaniska alfabetet var både musealt hanterbara och pedagogiskt illustrativa. Det fanns också en lång teknikhistorisk tradition att falla tillbaka på – och hämta legitimitet ur. Den så kallade Kungliga modellkammaren hade instiftats redan 1756. I den samsades Polhems småmodeller med elaborerade modeller av gruvmaskiner och sinnrika lantbruksmodeller. Besökare tyckte om att titta på dem, modellkammaren var närmast en turistattraktion, och dårtidens modeller bör därför också ses som ett slags underhållningsmedium; några framstod rentav ”som praktpjäser – en teknologisk fantastik.”

I forskningsprojektet ”Digitala modeller” har – som påtalats i den här bokens introduktion – trämodellerna i det mekaniska alfabetet digitaliserats på olika sätt: som CT-skannade objekt, som 3D-modeller, som datorgenererade videoanimationer, eller som virtuella objekt i en datorsimulerad VR-miljö. Med Althin har det handlat om att åskådliggöra hur ny teknik, denna gång digital – snarare än televisuell som han tänkte sig 1939 – kan ge nya perspektiv på äldre former av tekniskt-pedagogiska hjälpmedel. Det finns med andra ord en betydande kontinuitet mellan hur Polhem (och hans elever) tänkte sig att modellerna skulle användas, hur Althin (och andra intendenter) ställde ut dem på Tekniska museet, och de sätt som vi i vår forskargrupp arbetat med att digitalisera dem. Faktum är att det finns än mer precisa kopplingar; Althin menade som sagt i radio att tv varit allra bäst för att ”beskåda” dessa modeller, och när en ny ”Polhemsutställning” invigdes med modellerna 1970 var de ”kompletterade med audiovisuella presentationer”.

Syftet med denna artikel är meta-musealt – på två olika sätt. Ambitionen är att med Polhems mekaniska alfabet som fallstudie både säga något om dessa trämodellers fascinerande historia, och om tillblivelsen av Tekniska museet, en institution som i hög grad formerades med hjälp av, och kring dessa modeller. Med inspiration från forskningsfältet kring materiella kulturstudier, där museala objekt och deras ’liv’ i skiftande historiska kontexter görs till studieobjekt, är tanken med vår artikel att skissera det mekaniska alfabetets långa historia. Tingens biografier kan avslöja vad som annars förblir dolt, har antropologen Igor Kopytoff hävdat. Den typen av resonemang ingick i en bok, The social life of things. Commodities in cultural perspective – redigerad av antropologen Arjun Appadurai 1986 – en studie som fått stor betydelse för den här typen av perspektiv. På senare år har den så kallade ”objektbiografiska metoden” ytterligare accentuerat sådana synsätt, inte minst för att ge ”konkret tyngd åt mer filosofiska resonemang kring det materiella.”

Även inom vetenskapshistorien har studiet av objekt och vetenskapliga praktiker blivit allt vanligare. Vetenskapshistorikern Lorraine Daston gav till exempel år 2000 ut forskningsantologin, Biographies of Scientific Objects, i vilken en återkommande tanke var att vetenskapliga objekt görs genom praktik, förevisningar, laboratoriearbete eller publika demonstrationer. Faktum är att det mekaniska alfabetet utgör ett synnerligen illustrativt exempel på vad Daston kallat för ”the coming into being of scientific objects.” En biografi kring det mekaniska alfabetet kan därför säga oss en hel del om hur relationer mellan människor och ting förändrats över tid.

Även vetenskapliga modeller har analyserats med en materiell-historiskt vokabulär. I Tyskland publicerades till exempel för några år sedan boken, Das materielle Modell. Objektgeschichten aus der wissenschaftlichen Praxis där objektshistorier och vetenskapliga praktiker studerades. De utgick från konkreta vetenskapliga modeller som övergivits på unversitetsvindar och i källarförråd, men där modellerna (som vetenskapliga objekt) fortsatt berättar om gångna tiders akademiska synsätt och pedagogiska ideal. Det är just sådana användningsområden och praktiker som vi är intresserade av i den här artikeln. Genom att anlägga ett mycket långt tidsperspektiv – från trämodellernas möjliga ursprung (proveniensen är oklar) i Polhems Laboratorium mechanicum 1696, över etableringen av Kungliga modellkammaren 1756, till samlingens spridning och skiftande öden i allehanda utställningskontexter och användningsområden under 1800-talet – där modellerna gick från att ha varit högt skattade pedagogiska hjälpmedel på Teknologiska Institutet i Stockholm till KTH-vindskammrarnas undanskuffade tillvaro – för att till sist genom Althins försorg kring 1930 omskapas till uppburna museala objekt och en ”enastående kulturskatt”, menar vi att det är möjligt att säga något väsentligt nytt både om Tekniska museet som institution och hur teknikhistoria har profilerats och positionerats inom ett museipolitiskt fält. Det är alltså inte Polhem som står i centrum för vår artikel – han är snarast en bifigur – utan fastmer de sätt som hans ”originalmodeller” transformeras från tidigmoderna pedagogiska redskap till vindsskräp, för att till sist betraktas som uppburna auratiska museiobjekt.

Torsten Althin intar en särställning i sammanhanget. I egenskap av grundare av Tekniska museet är han centralfigur i vår berättelse, både i kraft av att bokstavligen räddat det mekaniska alfabetet från förgängelse och snillrikt ha profiterat på dess oklara proveniens. För att använda en mekanisk metafor blev Polhems teknikhistoriskt uppburna persona och hans åldriga modeller en hävstång för Althin i hans arbete under det sena 1920-talet med att etablera och formera ett tekniskt museum. Om man betänker att han 1924 anställdes som chef för Tekniska museet – vilket då ”bestod av ett tomt skrivbord” i Ingenjörsvetenskapsakademiens bibliotek – framstår det som en minst sagt remarkabel insats. Lika slugt som drivet lyckades Althin med att bygga upp sitt museum kring dessa modellers biografiska legend. ”Tekniska museet kan sägas ha de äldsta anorna, ty det härstammar från Christopher Polhems tid”, kunde man exempelvis läsa i en ingress till en artikel av honom 1932. Museet har ”lyckan att kunna utgå från en samling modeller [vilka senare] under namn av K. Modellkammaren utgjorde såväl ett institut som ock ett – tekniskt museum.” ”Jag vågar gå så långt”, påpekade han till och med i en tillbakablick några år senare, ”att jag påstår att det icke i något annat land finnes ett tekniskt museum, som i grund och botten kan leda sina anor så långt tillbaka i tiden och har ett så förnämligt ursprung som museet i Stockholm.”

I fokus för den här omfattande artikel står alltså några små trämodellers biografiska liv under drygt tre hundra år. De har kommit att kallas ”det mekaniska alfabetet”, även om Polhem aldrig benämnde dem så. Inte heller är det troligt att de modeller som idag finns kvar är ”Polhems originalmodeller” (som Althin hävdade). Modellerna var sköra och sammansatta av en mängd olika små träbitar (sammanfogade med metallstift). De användes flitigt under årens lopp, behandlades inte speciellt varsamt och bevarades (före 1930) inte alls som museiföremål. Tvärtom, eftersom tanken med dem var att visa rörelsemoment – exempelvis hur en roterande rörelse övergick till en horiosontell rörelse – så kom de förstås att användas både av besökare på Kungliga modellkammaren och senare av studenter på Teknologiska Institutet under 1800-talet. Och eftersom modellerna var bräckliga får man förmoda att de gick sönder när de nyttjades år efter år av nya besökare och nya studentomgångar.

När Althin väl såg till att ta hand om dem, lagades och restaurerades de av modellmakare på Tekniska museet. Modellerna lappades samman, delar byttes ut, man rekonstruerade bitar som fattades etcetera – varför det idag inte är mycket som talar för att beteckningen ”originalmodeller” är en adekvat beskrivning. Möjligen kan några få delar vara ålderstigna och datera sig till 1700-talet, men att det skulle handla om originalmodeller – på det sätt som man vanligen betraktar ett original – är inte sannolikt. Det är därför mycket svårt att fastställa hur gamla de egentligen är; modellerna är också för små att analysera med hjälp av dendrokronologi (det vill säga, att datera trä med hjälp av årsringar).

Icke desto mindre är vi i det följande intresserade av de trettiotalet modeller som både ställts ut och bevarats på Tekniska museet, liksom av samlingens fascinerande öde – själva tingens biografi. Å den ena sidan försöker artikeln frilägga de mest centrala utställnings- och användningsområdena för dessa modeller under en längre tidsrymd, å den andra sidan står skiftande minnes- och museipolitiska handlingsprogram (som modellerna gav upphov till) i fokus. Här är Althin förstås central, men Polhems modeller gav redan vid mitten av 1700-talet institutionsbyggande impulser. Ingenjörsofficeren Carl Knutberg pläderade exempelvis redan 1754 om behovet av en nationell modellkammare, Tal om nyttan af et laboratorium mechanicum.

Vår artikel är strukturerad i fyra separata men sammanhängande delar, en sorts materiella berättelser som tar avstamp i lika många historiska kontexter – Carl Johan Cronstedts skissbok från 1729, trämodellernas funktion på Teknologiska Institutet under 1800-talet, Torsten Althins vurm för och institutionella användandet av det mekaniska alfabetet under 1920- och 30-talet, samt trämodellernas utställningssammanhang på Tekniska museet efter 1950. Avslutningsvis diskuterar vi hur vårt eget forskningsprojektet ”Digitala modeller” dels kuggar in i, och (för närvarande) utgör en sorts slutstation för det mekaniska alfabetets biografi, dels hur vårt projekt (genom bland annat den här artikeln) givit upphov till en ganska ovanlig, reflexiv forskningsinsats kring en för Tekniska museet mycket central samling av objekt.

Folkbibliotek och digitalisering

Idag på Umeå universitet höll jag en föreläsning för biblioteksstudenter på momentet “Bibliotekets historia och samhällsroller”. “Folkbibliotek och digitalisering” kallade jag det hela, och tanken var att ge en bred idébaserad introduktion till hur biblioteket som idé och funktion förändras i och med digitaliseringen av informationslandskapet. Slides från föreläsningen kan laddas ned här: snickars_bib_infovetenskap_2018.

datalab.kb.se – A Report for the National Library of Sweden

About a year ago I was asked if I had an interest to examine, survey and evaluate in what ways a library lab might – or could be – established at the National Library of Sweden. As a media studies professor at Umeå University, I have for a number of years worked and done research at the digital humanities center Humlab. I accepted the offer and from January 2018 I have been working (part time) during nine months with my report (and ways to prepare the ground for making my recommendations a reality). Funding for my work was made available by Riksbankens jubileumsfond and the National Library of Sweden. Lars Björk (at the National Library) has functioned as my co-worker. The report is entitled datalab.kb.se — it is a term Björk and I suggest for naming an eventual datalab at the Swedish KB, where the digital and Swedish connotation are obvious (including a necessary distinction and contrast to the Danish and Dutch KB Lab). The report can be downloaded here: datalab.kb.se.

Towards a first draft of my report on the library lab – datalab.kb.se

My work with writing a report for the National Library of Sweden on the establishment of library lab is progressing fine. The text should be finished in a few weeks time, and presently the first pages – in a first draft – reads as follows:


Introduction
The Annual Report from the British Library usually offers insights into the many domains and whereabouts of national libraries—not the least in terms of future directions. In the latest report (from 2017/18) it is, for example, stated that the British Library “Digital Scholarship team” continues to “undertake innovative research with digital collections and open up new datasets for use by researchers.” One way to facilitate digital scholarship is to start a lab, and the British Library set up a library lab environment already in 2013. Ever since the British Library Labs has been inviting researchers, developers and artists “from around the world” to undertake “creative endeavours” using the library’s digitally curated collections, content and data. Following the latest Annual Report, the Library Labs team has now “facilitated the use of over 180 terabytes of data including 97 freely available datasets at data.bl.uk. One example is the In the Spotlight project which makes digitised entertainment playbills from the 1730s to the 1950s available as a single dataset.”

Digital scholarship, curated data, single datasets, invited developers and programmers—these are all present buzzwords and novel categories within the library domain. Before computational expertise were necessary and primarily required for internal workflow within IT departments—now such skills and competencies are increasingly turning into a prerequisite for doing actual research in a gradually altered library infrastructure that is increasingly turning digital. This infrastructural and scholarly transformation can appear as swift and sudden. Yet, digitisation activities within the ALM-sector (archives, libraries and museums) has been a harbinger of novel times to come—both in terms of scholarly perspectives and library practices.
National libraries have been digitising their collections for decades—in Sweden digitisation work started already in the late 1990s. For a number of years, collections were digitised primarily for preservational purposes, but after the millenium—due to the rise of the Web and initiatives as Google Books—digital access to library collections steadily became more important. Permission to use library collections were, however, often hindered by copyright legislation, and digital access was foremost given to older (textual) collections prior to the 20th century.

Digitisation work performed at the National Library of Sweden has in general been similar to other European countries. The library has digitised a major amount of its audiovisual collections, various selected works from the print collections, and a large amount of newspapers. The latter has been a prioritised category since newspapers are an important research material for many users. Born digital collections have also grown through web archiving activities (Kulturarw3) and audiovisual deposits, and even more so since 2015 when (some) electronic materials became subject to legal deposit. Regarding the digital trajectory that the National Library has undertaken during the last 15 years, preservation was most important at first, then digitisation for access was increasingly advocated. There are, however, also good reasons to question the distinction between digitising for access and digitising for preservation. Some scholars have even argued that the split “is artificial and misleading” since access to collections are usually “a given” and an outcome of all digital transformation—even if usage is fully realised only through functioning electronic networks and the legal frameworks that manage permissions.

Nevertheless, during recent years digital scholarship within the ALM-sector has expanded the focus of digitisation activities towards different forms of investigations and explorations. Thus, there has been a scholarly driven progression within the institutional heritage domain from preservation to access—to analyses. Today all forms of digital heritage are computationable—hence, how to enhance and increase the research potential of this material? If humanities and social science scholars traditionally were interested in the collections that archives and libraries had to offer deep down in their stacks and vaults, such archival driven humanities research has thus turned into data driven research due to the digitisation of heritage. And more data is better data (as Google would have it).

The long-term magnitude of this ongoing transformation is striking—both for scholars and libraries. Within the library sector the gradual alteration effects the very foundation and principles of what libraries are—and should be at a time when ‘the digital’ is slowly becoming default. Today, governmental decrees for national libraries (and similar statutes för university libraries) usually stipulate that libraries are to provide a beneficial infrastructure for research. During centuries great book and manuscript collections at university libraries and national libraries played a pivotal role for the humanities and social sciences. They were envisioned as a key infrastructures for scholarship. National libraries and deposit laws are, in fact, illustrative examples of how traditional knowledge structures were enacted through concrete and primarily humanistic infrastructures. They have essentially remained the same over centuries, but have during the last decade—due to repeated digitisation efforts—begun to alter.
As digital copies of heritage start to become a preservational focus for the ALM-sector, novel ways of giving access and sustaining digital scholarship are the flip coin of the same digital development. In short, mass digitisation combined with new media, technology and distribution networks has transformed the possibilities for libraries and their users. Emerging scholarly disciplines—from data science and data journalism to the digital humanities—all take advantage of new computing tools and infrastructure, and provide different models for creating new forms of access to and analyses of library collections. Especially within digital humanities scholarship the systematic intertwining of research questions, digital materials, and tools have stressed the need to reformulate what an apt library and research infrastructure for the humanities (and social sciences) should pertain. Digitisation has in essence begun to transform the epistemic foundation of the library. The knowledge than can be deduced from collections in digital form is different—and foremost one of scale. So called distant reading of major textual corpora have even been envisioned as a new “condition of knowledge”.


About the Report
About a year ago I was asked if I had an interest to examine, survey and evaluate in what ways a lab might—or could be—established at the National Library of Sweden. As a media studies professor at Umeå University (a chair directed towards the digital humanities) I have for a number of years worked and done research at the digital humanities center Humlab. I accepted the offer and applied for the position—a PM for a “pilot study” on a data lab at the National Library was drafted by library personnel Lars Björk and Peter Krantz, and additional funding was made available by Riksbankens jubileumsfond.

Together with professor Patrik Svensson (Umeå University / UCLA), I had at the same time (during autumn 2017) organised a conference on data driven humanities research at KTH, partly aimed at guiding (and hopefully influencing) preparatory work at the Swedish Research Council and its future funding for research project grants around “digitisation and accessibility of cultural heritage collections” (a call that went public in May 2018). Together with Svensson (and a distinguished group of Swedish humanist) I have also been active in raising awareness (or lobbying) for the need of strengthening and developing new forms of humanistic infrastructures. The idea to investigate how a lab at the National Library could be initiated was thus consistent with a number of similar research activities and ideas, including work at funding agencies—a call committed to quantitative and qualitative methods has also been in preparation at Riksbankens jubileumsfond.

From January 2018 I have been working (part time) during nine months with this report— including ways to prepare the ground for making my recommendations a reality. Lars Björk has functioned as my co-worker. During winter, spring and summer 2018 we visited a number of scholarly environments, university libraries and research groups in Sweden with an interest in using a lab at the National Library. We have thus talked to many Swedish scholars and librarians with an interest in the matter; we established both a reference group and a steering committee for our work; we made a study trip to the British Library Labs and the Dutch KB Lab; we sent out a survey regarding available digital collections within the ALM-sector in Sweden (Appendix A), and we presented and discussed our work within the “Group for digitisation and digital access” (with me as chair and Björk as secretary), a group that is part of the “Forum for national library collaboration and development”. I have also made a number of presentations of our lab ideas at Swedish universities, at the management board of the National Archives, at the Research board of the National Library, and at national and international conferences. Furthermore I organised a workshop on digital scholarship at the National Library (in April 2018) with some 25 scholars and librarians (funded by Riksbankens jubileumsfond). Our preparatory work, conversations and scholarly visits have been thorough.

This report is entitled datalab.kb.se—it is a term Björk and I suggest for naming an eventual lab, where the digital and Swedish connotation are obvious (including a necessary distinction and contrast to the Danish and Dutch KB Lab). The report is divided into three subsequent sections—“Library Labs” and “Digital Scholarship” (with some subsections)—as well as a final part on “Recommendations”. The first part sketches and maps the international terrain of current library labs, with a focus on different lab environments at national libraries. The second section puts novel forms of computational scholarship at the center of attention, with a particular emphasis on methods and (necessary) curation of datasets. In the final section on recommendations I suggest how a lab at the National Library could be organised, focusing both on actual tasks and workflow, as well as job descriptions and required skill sets.


Library Labs
Digitally inclined research within the humanities and social sciences have during the last decade started to influence both national and university libraries to take advantage of the scholarly possibilities that arise when documents as data are sharable and networked, linkable and traceable, reusable and processable. The development and set up of library labs is one concrete result. The primary function of library labs are to deliver digital collections as data (or datasets) to researchers and other interested users. Following the literal meaning of the term laboratory—“a room or building equipped for scientific experiments”—library labs are usually devoted to experimentation with provided datasets. “British Library Labs – experiment with our collections”, as the slogan goes. Library labs can hence be envisioned as a scholarly, artistic or creative industries playground. The British Library Labs is an endeavor that supports and “inspires the public use of the British Library’s digital collections and data in exciting and innovative ways.” In a similar manner the Dutch KB Lab wants to be experimental; “we try out new techniques and tinker with tools to make our content as accessible as we can. Warning, that means stuff can be broken.”

However, since library labs are becoming more and more common, the focus on experimentation can also become misleading. Providing datasets and working with these in different ways is today hardly cutting edge. Hence library labs can also increasingly be perceived as a core service that national libraries provide, with the lab (or its services) becoming an integrated part of a developed digital infrastructure. Such perspectives were advocated at a recent conference at the British Library, Building Library Labs in mid September 2018. It brought some 40 libraries and partner institutions from North America, Europe, Asia and Africa—with no less than ten national libraries present. “Around the world, leading national, state, university and public libraries are creating ‘digital lab type environments’”, the conference program stated. The aim is to develop novel forms of library usage, where library labs ensure that “digitised and born digital collections / data can be opened up and re­used for creative, innovative and inspiring projects by everyone such as digital researchers, artists, entrepreneurs and educators.”

The issue of library labs is hence timely. Presentations and discussions in London evolved around issues as labs services and spaces, technical infrastructures, the values of a library lab, planning a lab and establishing it, as well as various funding models for labs. Usage, research and different presentations of ongoing projects were also on the agenda. One result of the conference was a supportive network, another a forthcoming global report on library labs. Most libraries and institutions present did also take part in a library lab survey. The results are in no way conclusive, but rather give a tentative impression of how major libraries presently deal with lab issues (Appendix B). One thing to note was that library labs started to emerge between 2013 and 2015, and that this first wave of initiatives is now reinforced by a more general trend (following the survey some 20 libraries are about to launch a lab in 2019 or 2020). Most of the existing library labs are furthermore aimed to serve academic research followed by internal staff, the general public or creative industries. The most common tasks according to the survey were “facilitating access to data & digital collections at scale” and “creating new datasets & digital collections”, followed by “providing training in digital methods & tools” and “public engagement”. Half of the library labs provided access to restricted digital collections (through various contracts), and (only) half of them offered a physical space in the library—thus for many library labs focus is mostly put on web based presence. The Austrian National Library lab, ÖNB-LAB, for example (to be launched in November 2018) will foremost devote its activities to a homepage with datasets and tools, including code and tutorials provided through Gitlab.

At present there is, in short, a considerable international interest in library lab issues (and the prime reason why this report is written in English). Even if library labs are usually established with the purpose to enhance and amplify digital usage of digitised (or born digital) collections and datasets they differ in approach, scope and orientation. The library lab at the Yale University Library, for example, has a distinct digital humanities agenda, all in order to help “scholars in their own engagement with digital tools and methods in the pursuit of humanistic questions.” Therefore a brief description of some different types of library labs can serve as a smorgasbord of how labs can be designed, organised and accustomed.