Review – Data, Driven: Spotify Under Surveillance

Angus Batey at The Quietus has written one of the best and most interesting reviews of or book, Spotify Teardown: Data, Driven: Spotify Under Surveillance. The book, it is argued, “contains a significant amount of material that needs to be fed into the wider debates around internet-enabled technologies in which the user is not the customer but an intrinsic component of the end product.” A particularly valuable insight from the book, Batey also states “is the authors’ gentle but sustained unpicking of the notion of a “tech platform”. This formulation, they suggest, is merely another means by which tech companies attempt to keep themselves more than a regulator’s arm length away from traditional media outlets. Describing themselves as “platforms” enables these businesses to insinuate that they should not be governed by the same laws that proscribe and regulate the activities of publishers. Like Facebook and Twitter, which use their “platform” status to avoid the responsibility for libel that a newspaper publisher has to accept, Spotify hides behind the designation when it wants to sidestep regulations that would apply to broadcasters – even though, by curating its playlists and presenting its service as an enabler to “music discovery”, it has long ceased to be a neutral connector of listeners and music.”

Piles of Files: The Infinite Archive

Tomorrow I will give a short talk and participate in a panel in Berlin (Haus der Kulturen der Welt) around the theme: Piles of Files: The Infinite Archive. Following the program, “digitalization holds many promises: extensive accessibility, reactivation of dusty recordings and infinite storage options. The emerging platform technologies pose new challenges for institutional archives and collections. At the same time, however, the transition from collected objects to stored files also entails the random accumulation of masses of data and recycled audio culture, in principal retrievable anytime from streams and clouds. In future, the ascendance of past cultural- and knowledge production compared to those of today will become overwhelmingly large. But who listens to all of these MP3s?” I guess that I will both stress the way in which digital archiving of media assets has been radically altered during the last decade, but also pick up on some the experiences learned after working with Spotify for a number of years.

Anteckningar om kortkatalogens mediehistoria

Arbetet med boken, Dokumentation & representation. Om de svenska minnesinstitutionernas mediehistoria, går framåt. Jag håller fortsatt på med det kapitel som behandlar hur kataloger (och då framför allt kortkataloger) varit en viktig medieform främst för bibliotekssektorn. Fokus i kapitlet ligger på Kungliga bibliotekets kataloghistoria, men en rad internationella utblickar förekommer också. Nedan utgör utsnitt ur det kapitel som nu håller på att ta form:

Nära nog alla epoker i det förflutna har brottats med ett både reellt och inbillat informationsöverflöd; Too Much to Know heter den klassiska boken på området. Redan för att hantera innehållet i det antika biblioteket i Alexandria – som kan ha haft så många som 400 000 bokrullar – behövdes ett informationshanteringssystem för att förteckna beståndet. Dahlgrens ämbetsbroder Zenodotos, biblioteket i Alexandrias förste föreståndare som levde mellan år 330 till 250 f.Kr., har bland annat gått till historien eftersom han försökte skapa ordning bland alla dessa bokrullar. De var bökiga att organisera och saknade både fram- och baksida (liksom bokrygg). Men genom att förse varje bokrulle med en liten lapp som angav författare, titel och ämne åstadkom Zenodotos en rudimentär förteckning. 

Redan på 300-talet e.Kr. hade pergamentet börjat tränga undan papyrus som skrivmaterial, och antikens bokrullar ersattes då gradvis av ett nytt bokformat, codex, där lösa pergamentblad viktes eller bands samman till en ny helhet, en bok med omslag och sidor. Fram till 1100-talet var det främst inom klosterväsendet som bokproduktion ägde rum och hölls vid liv, dock i maklig takt eftersom munkar för hand skrev av böcker för klostrets behov. Med de medeltida universitetens uppkomst etablerades så småningom en kommersiell bokmarknad, inte bara av andliga utan också profana böcker. Och genom Johann Gutenberg (1394–1468) boktryckarkonst vid mitten av 1400-talet påbörjades stegvis en alltmer ökande massproduktion av tryckta böcker. Kring år 1500 hade mer än 40 000 böcker tryckts i tio miljoner exemplar, och de framstod nu som ett nytt materiellt medium med idag (fortfarande) välbekanta karakteristika som framsida, försättsblad, innehållsförteckning, kapitel, index, baksida och bokrygg. 

Även bokförteckningar och kataloger övertog codex-formatet, och de ”bundna volymer” som Dahlgren refererade till utgjorde länge default när böcker förtecknades. Medeltidens bibliotekskataloger fylldes alltså successivt på, rad efter annan, när nya böcker införskaffades eller kopierades. På klosterbiblioteken skrev munkarna ned både information om böckerna (metadata) liksom (förhoppningsvis) var de var uppställda. Katalogen var med andra ord en sorts rumslig förmedlingsinstans – ett medium – mellan användaren och det innehåll hen eftersökte. Ofta brukar den bokhistoriska forskningen framhålla att den senare medeltidens mest berömda försök att sammanfatta dåtidens vetande var den schweiziske bibliografen Conrad Gessner (1516-1565) och hans, Bibliotheca universalis. Utgiven år 1545 var det en bokkatalog på latin (som dominerade vetenskapliga skrifter fram till slutet av 1700-talet), i vilken Gessner strävade efter att förteckna alla då hittills tryckta böcker (på latin, grekiska och hebreiska). Bibliotheca universalis (liksom supplementet Pandectae, en foliant publicerad 1548) omtalas därför i regel som den allra första bibliografin. Bokverket omfattade uppgifter, utläggningar och kommentarer av omkring 3 000 författare, utan hänsyn till kvalitativa kriterier. Snarare citerade Gessner och följde devisen från Plinius (den yngre) att ”ingen bok var så dålig, att man deraf ej kunde lära något.” En annan nyhet som Gessner introducerade var att samtliga författare listades med efternamn i alfabetisk ordning.

Gessner ska under det tidiga 1540-talet farit runt och besökt en mängd bibliotek i Europa, han granskade också listor från tryckare och bokförsäljare i sin jakt efter metadata om författare och titlar till sin universalkatalog. På ett sätt utgjorde hans bibliografiska arbete en sorts förstudie kring det kommande förtecknandet av böcker på katalogkort. Han lär nämligen inte ha kopierat uppgifter från diverse försäljningslistor av tryckta böcker, utan snarare klippt sönder dessa – och därefter arrangerat de olika papperslapparna i alfabetiska högar. I boken Pandectae – som innehöll olika slags klassificeringsstrukturer – uppmanade han rentav till ett medeltida cut-and-paste: ”klipp isär allt du har kopierat med en sax; ordna därefter pappersdelarna som du vill, först i större avdelningar vilka du sedan kan sortera så ofta som nödvändigt.”

Flera forskare har menat att denna bibliografiska praktik lanserades av Gessner – men det är inte troligt. Snarare pekar mycket på att det schweiziska klipparbetet föregicks med mer än 500 år av en arabisk bokhandlare i Bagdad vid namn Ibn al-Nadim. Han levde under slutet av 900-talet (de exakta årtalen är inte kända) och var författare till Kitâb Al-Fihrist (كتاب الفهرست) eller enbart Fihrist, – ”Katalogen”, eller möjligen ”Indexet” som är den bokstavliga översättningen till svenska – en kompilationsbok som har kallats för den första encyklopedin över medeltida islamisk kultur. Bagdad var vid denna tidpunkt världens intellektuella centrum; omkring år 800 hade ett bibliotek grundats i staden med ambitionen att samla all världens kunskap, en biblioteks- och katalogdröm som går igen i många senare kunskapsprojekt. al-Nadim lär till en början ha arbetat i sin fars bokhandel och där kopierat manuskript. Efter hand började han att förteckna information om böcker och författare på papperslappar och listor i ett försök att indexera all arabisk litteratur. Förmodligen gjorde al-Nadim enskilda noteringar om varje författare, och över tid ordnades de till ämnen i kronologisk följd, och när tillräckligt många papperslappar hade samlats på hög, ”the author undertook to compile them in the form of chapters for his book.” Under det sena 980-talet sammanställde al-Nadim katalogen Fihrist (i tio kapitel), till en början tänkt som ett slags användbart referensindex för kunder och handlare av böcker. Över tid kom al-Nadim att notera tusentals författare, biografiska data och verk på sina papperslappar, insamlade från regelbundna besök både hos privata boksamlare och bibliotek över hela regionen (inklusive städer som Mosul och Damaskus) – al-Nadim bibliografiska praktik var alltså densamma som Gessners. Det speciella med Fihrist, som publicerades i en första utgåva år 987, var därför dess heterogena karaktär. al-Nadim var bokhandlare, inte vetenskapsman. Han intresserade sig lika mycket för böcker om poesi, satir och musik från Persien och Babylonien, som biografiska detaljer, litteraturkritik och obskyr magi från Bysans. Förteckningar av religiösa och vardagliga skrifter, legender och fabler, bisarra poem och oanständiga alster samsades om utrymmet i Fihrist; katalogen svällde – en engelska utgåva är 1 149 sidor lång – och har följaktligen beskrivits som ”a tenth-century survey of muslim culture” och ”a true ’record of civilization’”. 

Gamla kataloger över ännu äldre böcker utgör inte alltid njutfull läsning, men trots att den är mer än tusen år gammal är Fihrist ett nöje att både bläddra och läsa i. Den framstår som ett medeltida sammelsurium av böcker och berättelser, röster och skeenden hämtade från den islamiska högkulturens Bagdad. ”Rabi’ ah al-Baṣrĩ”, nedtecknade al-Nadim, var en nomad som blev stadsbo; han var både poet och en kännare av den muslimska traditionen. ”Among his books there were … Yearning of the Camel of the Homeland”; Abū al Hasan var en av de främsta teologerna i Bagdad, men de flesta av hans böcker var inte skrivna utan dikterade. Vidare informerade al-Nadim om att Al-Tūsi var en lärd och kunnig man, ”learned in the tradition of the tribes and the poems of preeminent men … [but] left no written works”. Al-Sūli sägs å sin sida ha varit en lysande boksamlare – och en av sin tids bästa schackspelare – medan Abu al-’Anbas var astrolog och skabrös författare till obscena skrifter om onani och ”onaturliga samlag” med titlar som Rare Anecdotes about Pimps eller Superiority of the Rectum over the Mouth på sin publikationslista. 

al-Nadims förkärlek för det vardagliga, profana och kulturellt lågstående har gjort att många islamologer betraktat honom som en sorts charlatan, ”a bumbling bookshop owner who, as a hobby, collected lists of old books in a cluttered office at the back of his shop.” Andra har dock hävdat att Fihrist snarast kan liknas vid en medeltida Melvin Dewey eftersom al-Nadims skapade ett slags klassifikationssystem – låt gå att det var högst personligt – över sin tids vetande. Även om al-Nadim använde sig av en teknik som påminde om en kortkatalog kan hans bibliografiska lapp-praktik knappast betraktas som ett systematiskt och (bokstavligen) regelrätt förtecknande av författare och böcker. Gessners arbete vid mitten av 1500-talet ligger då närmare till hands, men inte heller han arbetade med standardiserade, separata kort. Samtidigt som likheterna mellan dessa bägge tidiga bibliografer är uppenbara, finns det emellertid inget egentligt skäl att i mediehistorien försöka lägga fast vem som var först. Snarare bör det framhävas att i takt med att bokproduktionen ökade under den tidigmoderna tiden så uppstod ett behov av att förteckna boktrycket på nya sätt. Genom tryckta böcker gjorde tidens tryckkapitalism inte minst reklam för andra böcker; de innehöll inte sällan en förteckning över tryckeriets övriga utbud, och dessutom tillkom kataloger och annan marknadsföring. Om det år 700 producerats omkring 120 böcker per år i världen, hade siffran vid slutet av 1700-talet stigit till 20 miljoner exemplar. 

På tidens allt fler bibliotek fortsatte man dock med att skriva in titlar – i ännu fler inbundna volymer. En av Kungliga bibliotekets äldre kataloger från 1700-talet (U 119) kom att innefatta hela 18 inbundna volymer. Att en sådan biblioteksteknik var svår att anpassa till ökade tryckvolymer blev alltmer uppenbart, inte minst efter att flera Europeiska länder under den tidigmoderna tiden infört olika former av pliktleverans (ofta till ettdera kungligt bibliotek): 1537 i Frankrike, 1662 i England, 1697 i Danmark – och 1661 i Sverige, då landets första pliktleveranslag stadgade att ett exemplar av varje trycksak som framställdes i riket (och dess underliggande provinser) skulle lämnas till det kungliga kansliet i Stockholm. Pliktleveranslagarna hade dock ingen kulturarvsfunktion; de var snarare censurinstrument med syfte att kontrollera hur den tilltagande tryckta informationen spreds.

Kontroll, överblick och ordningsskapande var även tankefigurer och praktiker som tidens vetenskapsmän började att uppmärksamma, exempelvis hur information, kopierade excerpter och referenser metodiskt kunde organiseras på nya sätt. Någon standardiserad systematik var det ännu inte frågan om, men det tyska universalgeniet Wilhelm Leibniz (1646–1716) ska under det sena 1600-talet organiserat sina anteckningar och excerpter i enlighet med idéer kring ett Arca studiorum, lanserade av den brittiske officeren Thomas Harrison (1606–1660, avrättad). I ett manuskript från slutet av 1630-talet påtalade Harrison att Arca studiorum var ett sorts repositorium, ”by means of which it is proposed that all the things one has read, heard, or thought can be more speedily arranged, and more readily used.”  I korthet, handlade det om ett slags (Noaks) ark för studier, där små papperslappar hängdes upp på krokar i enlighet med ett fördefinierat system av ämnen.

Snabb och effektiv organisation av information var också något som Carl von Linné (1707–1778) använde sig av under 1700-talet. Linné nyttjade en sorts egenhändigt konstruerad pappersbaserad informationsteknologi där han på små kort – med de ungefärliga måtten 13 gånger 7,5 centimeter – förtecknade inkommande information om djur och växter som skickades till honom på nästan daglig basis. På The Linnean Society i London finns mer än 1 000 sådana papperskort bevarade, varav merparten är av botanisk art. Eftersom Linné ägnade sig åt systematisk klassifikation ligger det nära till hands att tro att det just var han som uppfann den standardiserade kortkatalogen (vilket somliga forskare antytt).  Samtidigt var de papperskort Linné använde tillverkade för hand, på samma sorts brevpapper som han använde för korrespondens och anteckningar. De var sladdriga i kanterna och förefaller inte samlats annat än i högar, eller klistrats fast i Linnés manuskript – i vilka de också förekom att botanisten själv fästade pappersbitar med små nålar (som om de var insekter).

Under 1700-talet uppkom ytterligare ett nedteckningssystem av boktryck – spelkort. Spelkortets historia är gammal; franska jeu de cartes (med 52 kort och jokrar) daterar sig till 1400-talet, men de har i regel haft samma format (nio gånger sex centimeter). 1731 startade den första svenska spelkortsfabriken i Stockholm, och omkring femtio år senare började den engelske historikern Edward Gibbon (1734–1794) att förteckna sitt stora, privata bibliotek på baksidan av spelkort. Varifrån Gibbons fick inspiration till detta påfund är okänt, men spelkort var enkelt åtkomliga, förhållandevis standardiserade, och hade framför allt vita baksidor (till en bit in på 1800-talet). Somliga poster i sitt bibliografiska kartotek hade Gibbon själv registrerat, påtalar Jonas Nordin en artikel om brittens omfattande bibliotek, men främst var ”det någon annan person, som bara haft ytlig kännedom om böckerna och deras innehåll, som hållit i pennan. Det är oklart om kortkatalogen var en tillfällig eller permanent lösning, men Gibbon hade behov av flexibilitet eftersom hans böcker var spridda på flera orter och sannolikt hade han ambitionen att någon gång sammanföra dem.”

Under 1700-talet fortsatte såväl national- som universitetsbibliotek att förteckna bestånd i inbundna kataloger på ungefär samma sätt som tidigare. I bok- och bibliotekshistorien brukar det därför anföras att det krävdes en revolution (den franska) för att få till en ny biblioteksteknik (kortkatalogen) som kunde hålla jämna steg med samtidens stigande tryckproduktion. Franska revolutionen 1789 visade sig just bli starten för en ny biblioteksteknik som i stor skala använde spelkort som lagringsmedium för metadata. Men Gibbon föregrep alltså denna praktik, och därtill hävdas det ibland att Hofbibliothek i Wien under 1780-talet var det första bibliotek som upprättade en kortkatalog. 

Vem som var först spelar mindre roll, snarare kan man notera att nya nedskrivningstekniker prövades i samtiden. Av dessa är det franska exemplet mest illustrativt. Bakgrunden var att revolutionärerna i nationalförsamlingen hade nationaliserat (det vill säga, konfiskerat) stora delar av det franska bok- och biblioteksbeståndet med avsikten att sälja dessa böcker (eftersom statskassan sinade och Frankrike höll på och gå bankrutt). När man insåg att bokförsäljning inte skulle inbringa några större summor, beslöts istället att boksamlingarna skulle ligga till grund för ett nytt, allmänt tillgängligt biblioteksväsende. Ett första steg var dock att få överblick över boktillgångarna, och en bibliotekarie (Gaspard Michel LeBlond) föreslog därför att en nationell samkatalog skulle registreras på spelkort. I en pamflett från 1791, Instruction pour procéder à la confection du catalogue de chacune des bibliothèques, en instruktion för färdigställande av kataloguppgifter från varje franskt bibliotek påtalades därför att alla böcker först skulle förtecknas (på spelkort, cartes à jouer) för att därefter göras tillgängliga. Baksidan på spelkorten skulle användas för metadata, skrivet på höjden, där uppgifter om författare och titlar skulle understrykas. 

I den femtonsidiga pamfletten gavs tre grafiska exempel på exakt hur förtecknandet av metadata skulle gå till. Denna skulle nedtecknas ”exactement sur cartes”, korten skulle därefter samlas upp i varje regional distrikt för transport till Paris ”dans des boëtes bien garnies de toile cirée en-dedans & en-dehors”, det vill säga i lådor klädda i vaxduk både på in- och utsidan. Nationalförsamlingens revolutionärer ville naturligtvis skydda spelkorten med biblioteksbeståndets metadata från väder och vind. I vaxduksklädda lådor transporterades spelkorten därefter till en bibliografisk enhet som upprättats i Louvren i Paris (vilken revolutionärerna gjort om till publikt museum). Under tre år användes hela 1,2 miljoner spelkort för att förteckna omkring tre miljoner böcker. Följer man instruktionen från 1791 var spelkorten en viktig materiell förutsättning för denna omfattande bibliografiska insats. Samtidigt var det uppenbart att mängden spelkort inte skulle räcka till; ”om det inte finns tillräckligt med spelkort, så kan dessa ersättas av bitar av papper”, påtalade instruktionen – ”mais les cartes sont préférables.” Det var emellertid inte bara spelkorten som gjorde denna katalogiseringsinsats remarkabel, den franska kataloginstruktionen innehöll också de första nationella bibliografiska riktlinjerna för hur bokbeståndet borde förtecknas. Bokhistoriker har dock påpekat att resultatet av detta revolutionära metadata-projekt lämnde en del övrigt att önska. Brist på kort gjorde ibland att spelkort klipptes itu, franska spelkort varierade därtill en aning i format (där en centimeter längre kort gjorde förpackning besvärlig), och i några fall förtecknade man på längden istället för höjden – och föregrep därigenom den kortkatalogstandard som sedermera utvecklades under 1800-talet.

”Why You Must Read ‘Spotify Teardown’”

The journalist David Turner has written a very enthusiastic review of our book Spotify Teardown. In my opinion, Turner states, "the most cutting part of Spotify Teardown wasn’t all the original research that went into the book or the claim that Spotify’s business was built on pirated music. Rather, what intrigued me the most was a small section about the company’s early days of investor funding. In 2012, while the company was still in the preliminary stages of entering the United States market, Spotify received a round of funding led by Goldman Sachs with an assist from Coca-Cola". Consequently, the review ends with the following: "Spotify Teardown shows a company much like all advertising-support music platforms, where the ultimate customer is Coca-Cola; not music fans nor artists." The review can be found here.


Review of Spotify Teardown in Big Think

Derek Beres at Big Think has written a great review of our book Spotify Teardown, Is Spotify spying on you? “While privacy concerns are aimed at Facebook, Google, Apple, and other big players, we seem to have overlooked one of the biggest private data brokers around. Spotify passes as a music distribution service, yet there’s much more being sent through your speakers”, Beres writes – and describing our book as an “incredible investigation [that] will open your eyes to an entire universe of data sharing and online marketing occurring at octaves too low for human consciousness to detect.”

Salon publish excerpt from Spotify Teardown

The American journal Salon has published a chapter from our book Spotify Teardown. “What happens when you create a fake music record label and upload bad music to Spotify? A scholarly experiment to figure out how Spotify works (and how to trick it)” – it is stated in a text that can be found here.

Roling Stone interview

Today the Roling Stone magazine has published a longer interview with me and my colleague Maria Eriksson around our joint book – ‘Spotify Teardown’ Is the Book Spotify Didn’t Want Published. “What do you know about Spotify, the Swedish music company? Five researchers who have spent the last several years investigating the inner workings of the global platform would argue that it is neither particularly Swedish nor truly a music company: They posit that Spotify is a shape-shifting tech business, serving as both a warning and a godsend to the record industry, and operating as a mass-media actor as deserving of public scrutiny as Facebook or Twitter.”

Utkast till bibliotekskatalogens mediehistoria

I det bokmanus som jag för närvarande arbetar med – med arbetstiteln: “Dokumentation & representation. Om de svenska minnesinstitutionernas mediehistoria 1750-2015” – är tanken att kapitel två ska handla om kataloger. Jag har struktur och disposition någorlunda klar för mig, och kapitlets anslaget ser för närvarande ut så här:

”Öfver-Bibliotekariens berättelse för år 1903” var ingen rolig läsning – vare sig för ”Kungl. Maj:ts” eller Riksdagen till vilken Kungliga bibliotekets årsberättelse var ställd. Den nyss nytillträdde chefen för KB, Erik Wilhem Dahlgren, beklagade sig uppriktigt över hur illa det var ställt med nationalbibliotekets kataloger, inte minst den bristfälliga förteckningen av de äldre beståndet. Framför allt den ”svenska afdelningen”, bekymrade Dahlberg, liksom nya ”större tillkomster [vilka] ännu till stor del [är] helt och hållet okatalogiserade”. Eftersom katalogerna lämnade en hel del övrigt att önska, gick det inte heller att svara på frågan om en bok fanns – eller inte. ”Olägenheten häraf göra sig så godt som dagligen märkbara”, påtalade Dahlgren irriterat, allt emedan det praktiska biblioteksarbetet ständigt blev lidande. ”Ofta kan frågan om ett arbetes befintlighet besvaras först efter särdeles tidsödande undersökningar, och någon gång gifva dylika undersökningar, oaktadt all använd möda, icke ens ett definitivt resultat.” Kungliga biblioteket kunde helt enkelt inte svara på om en efterfrågad bok faktiskt fanns i samlingarna – i alla fall inte med säkerhet. Bedrövat noterade Dahlgren att ”de påpekade bristerna skulle inom beräknelig tid afhjälpas, därför finnes tyvärr så godt som ingen utsikt.”

Som bekant innebär verbet ”katalogisera” att man gör en noggrann och detaljerad förteckning över något. För att användare ska kunna hitta, eller åtminstone orientera sig i en boksamling, måste den förtecknas med hjälp av olika former av metadata. En sådan förteckning kan struktureras och ordnas på en mängd olika sätt och genom mediehistorien har en rad olika katalogiseringstekniker också använts. Kring 1900 använde KB både inbundna katalogförteckningar och förteckningar på lösa blad, men Dahlgrens problem med ett ständigt ökande bestånd av okatalogiserat material och ett oroväckande informationsöverflöd var knappast någon nyhet. Redan det antika biblioteket i Alexandria brottades med samma problem, ett bibliotek som kan ha haft så många som 400 000 bokrullar. Den förste föreståndare, Zenodotos (som levde mellan cirka år 330 till 250 f.Kr.) har bland annat gått till historien då han försökte skapa ordning bland alla dessa bokrullar. Genom att förse varje bokrulle med en lapp som angav författare, titel och ämne åstadkom Zenodotos en rudimentär förteckning. I takt med att antikens bokrullar ersattes av ett nytt bokformat, codex – där handskrivna, lösa skrivark bands samman till en helhet – övertog även kataloger samma format. Medeltidens bibliotekskataloger fylldes successivt på, rad efter annan, när nya böcker kopierades eller införskaffades. Vad som förtecknades var både information om böckerna (metadata) liksom (förhoppningsvis) var i biblioteket de var uppställda. Katalogen var med andra ord en sorts rumslig förmedlingsinstans – ett medium – mellan användaren och det innehåll hen eftersökte. Dahlgrens problem var just att denna mediala förbindelslänk inte fungerade.

Det finns många olika typer av kataloger, men traditionellt har de bestått av en alfabetisk katalog efter författarens namn eller en boks titel, liksom mer ämnesvis uppdelade systematiska kataloger. Att förteckna information om en bok liksom var den befinner sig har varit syftet, även i digital form. Under 1860-talet beslutade KB att påbörja katalogisering med hjälp av lösa ark. Denna så kallade ”lappkatalog” lade grunden till en ny medieteknik för informationsbehandling som baserade sig på separata kort, ”cards” med intern KB-terminologi. Lappkatalogen och ”cards” användes parallellt på KB under 1900-talets första hälft, och det var först när (de ovanligt stora) korten i lappkatalogen paketerades i plåtkapslar kring 1960, som beteckningen ”Plåten” uppstod – en katalog som alltså kom att innefatta information om Kungliga bibliotekets tryck från äldsta tid till och med 1955.

När Plåten och de fysiska kortkatalogerna ersattes av databaser och gjorde sökbara över internet under 1990-talet – LIBRIS webbsök blev tillgängligt 1997 – var det emellertid fortsatt metadata om böcker som stod i fokus (samt lokalisering). Att KB 2010 digitaliserade Plåten – det vill säga metadata om bibliotekets bestånd – snarare än innehållet som katalogen hänvisade till är därför talande. Min poäng är att svenska minnesinstitutuioner i allmänhet, och nationalbiblioteket i synnerhet, orubbligt suttit fast i en äldre katalogiseringsteknik baserat på information om beståndet snarare än att ge access till själva innehållet. På webben kan man idag fortsatt läsa att ”LIBRIS är en nationell söktjänst med information om titlar på svenska bibliotek” (min kursiv). Denna gemensamma katalog med sju miljoner titlar uppdateras dagligen, och det är Kungliga biblioteket som har ansvar för drift och utveckling.

Att ange information om titlar, författare och ämnen har sedan Zenodotos tid utgjort kvintessensen av allt katalogiseringsarbete. Genom införandet av digital teknik har dock skillnaden mellan information om böcker och böckerna själva alltmer kommit att upphävas. Det stora digitaliseringsprojektet Google Books Library Project (med start 2004) är det bästa exemplet på hur metadata gradvis kom att, om inte ersättas så åtminstone kompletteras av själva innehållet (som metadatan beskrev). Google Books var till en början ifrågasatt (exempelvis av KB) men har under det senaste decenniet blivit till ett slags ledstjärna för hur de flesta minnesinstitutioner bedriver sin digitaliseringsverksamhet.

Det här kapitlet tar fasta på hur digitalisering av kultur- och bokarvet gjort att tidigare förtecknande och äldre katalogiseringsarbete framträder som en alltmer tydlig historisk medieform. Samtidigt har framför allt kortkatalogen varit ett lika kraftfullt som trögt medium kring förteckning av innehåll. Kapitlet handlar därför både om hur kataloger dokumenterat, representerat och reglerat innehåll som bevaras – och därigenom påverkat synen på samlingar – liksom hur långlivad denna biblioteksteknik varit.  Fokus ligger på böcker i allmänhet, och Kungliga bibliotekets kataloghistoria i synnerhet. Det finns empiriska belägg för att kortsystem bekrevs som ett medium (redan 1909), och i detta kapitel betraktas därför både bibliotekskataloger och kortsystem som en sorts medieformer, eftersom de sammabinder metadata med innehåll. Kapitlet inleds med en kort kataloghistoria, det redogör därefter för KBs lappkatalog liksom de ”amerikanska kortsystem” som med utgångspunkt i biblioteksreformatorn Melvil Dewey och hans företag Library Bureau kring 1900 kom att påverka och förändra hur samtidens svällande boksamlingar borde förtecknas. Dewey och Library Bureau fick årtiondet efter 1900 inget större genomslag i bibliotekssektorn i Sverige, men kortsystem kom likväl att införas på bred front inom den framväxande kommersiella kontorssektorn. Genom kortsystem är kontorets mediehistoria därför sammantvinnad med bibliotekets, och via en fallstudie av kontorsföretaget Axel Wibel AB tecknar kapitlet en något annorlunda bakgrund till dagens numeriska nedteckningssystem. Ur Axel Wibel AB utvecklades nämligen den svenska exportsuccén Facit AB, en industrikoncern som kring 1950 var Europas näst största producent av räkne- och kontorsmaskiner.

Digitalisering av svenska romaner

Inom ramen för vårt nya VR-projekt “Välfärdsstaten analyserad. Textanalys och modellering av svensk politik, media och kultur, 1945-1989” har det på sistone gjorts en hel del intervjuer med mig. De flesta har kretsat kring hur och på vilket sätt vi tänker oss att digitalisera alla svenska romaner från 1945 till 1989. Vi har alltså erhållit medel för att digitalisera dessa böcker så att maskiner kan läsa dem – inte människor. Hur de upphovsrättsliga frågorna ska lösas för att ge allmän tillgång till alla romaner ligger utanför projektets ramverk, även om jag själv kommer att försöka att driva denna fråga också. Biblioteksbladet har skrivit om frågan i artikeln 22 000 svenska romaner digitaliseras och sajten Boktugg i artikeln Det fria digitaliserade litteraturarvets olösliga ekvation.