A while ago I submitted an article to the Journal of Scandinavian Cinema as a kind of first report on the film heritage and web project around filmarkivet.se that I am in charge of. We have had some problems (to say the least) – and we have in fact launched a separate beta-site at filmarkivforskning.se. The draft is consequently entitled, “Reel Rot—Remarks on a Failed Film Archival Project”. I guess the text now needs to pass a number of peer reviewers – still, the piece starts like this:
During late autumn 2012 the second major funding agency for humanistic research in Sweden, Riksbankens jubileumsfond, decided to fund an infrastructural project with the purpose to develop the site filmarkivet.se—a joint venture between the Swedish Film Institute and the National Library of Sweden devoted to (mainly) historical nonfiction film. The aim of the application was to work with four parallel work packages—cataloguing, coding, contextualization and communication—in accordance with two major purposes: adding new cinematic categories to the site, and implement updated Web-based functionalities with a distinct user perspective. The application, in short, set out to significantly transform the existing site filmarkivet.se into a cinematic platform that met new digital requirement and expectations.
More than two years later not a single sign of this infrastructural project is visible on the site filmarkivet.se. Not even the edited (and CC-licensed) scholarly research volume, Skosmörja eller arkivdokument? (Jönsson and Snickars, 2012) is present—either as a downloadable PDF or simply as a metadata reference—remarkably so since the book formed the very basis of the entire project. In fact, up until now, this film project is a complete failure. No research functionalities are added, no new user interaction, no contextual material, no ways to comment or communicate. Nothing.
As the responsible scholar for this particular project, I am not writing this short subject article as defense or as an instance of rebutting evidence of some kind of accusation. On the contrary, I am fully aware that nothing has happened online—even if I have repeatedly argued that the site ought to be upgraded following the research plan. The purpose of the article is rather to ask myself what has gone wrong, what can be learned and what general insights film and media scholars can draw from this apparent debacle. The issue is, in fact, not without research political implications. Quite the opposite. Co-operations between the heritage sector and humanistic scholars are regularly envisioned as being beneficial and fruitful for all involved parts; in Sweden a major call for funding was for example recently issued by The Royal Swedish Academy of Letters, History and Antiquities regarding ‟Research and Collections”. Yet, regarding this film project it’s hardly my experience that I myself (nor my research group) have gained any general or scientific insights as a result of scholars and heritage institutions co-operating. Rather, due to radically different policies and approaches as to what audiovisual heritage institutions are instructed to do, academic perspectives have been totally neglected—even despised. All is not gloom, however, and I end with some suggestions how to resolve the project, in quite drastic ways.
Incompatible Film Heritage
The National Library of Sweden is a government agency under the auspices of the Department of Education and Research. The library’s task is ‟to collect, describe, safeguard and make accessible” all printed materials as well as all radio, television, film and music distributed in Sweden, primarily for research and the preservation of the nation’s cultural heritage (National Library of Sweden, 2015). The Swedish Film Institute also has a national responsibility for the nation’s film heritage; the mission is ‟to collect, catalogue, preserve and give access to Sweden’s film heritage”, for example via screenings at the Cinemateque (Swedish Film Institute, 2015). The focus of the Film Institute’s outbound activities is not research but rather popular education (understood in a broad sense). Thanks to a collaboration with the National Library, however, films in its collection are available for research. In addition, Swedish Television also has a substantial film archive. Archival copies are available for research, but academics cannot enter Swedish Television’s archival premises. The archive was established to facilitate television programs—not research.
These very different institutional aims, objectives and assignments regulating national film heritage has led to conflicting archival preferences in Sweden, especially regarding access. These opposing interests and intentions are the underlying archival rationale of why the infrastructural research project around filmarkivet.se has until now been a failure. Conflicting film archival policies and preferences have simply proven difficult to combine. Film scholars, in general, wants to work with vast and open online film collections and contextual media historical resources, a digital strategy the National Library has used in other online projects. The Swedish Film Institute, however, still seek to primarily give access to a curated filmic past (Jönsson, 2014) done under the aegis of ‟large-scale high-quality digitization”. In 2013 the Film Institute apparently managed to scan 20 fiction films in this way—a ridiculously low figure. A decade ago the Film Institute’s staff never mentioned access. Now it’s a buzzword: ‟The digitization of heritage films has the potential of providing access on an unprecedented scale, as new platforms have emerged to facilitate access and the fact that digital copies are not subject to same wear and tear as analogue film elements.” But to really provide access to film heritage you cannot scan 20 films a year—you need to mass digitize and radically alter the way you handle archival collections. Otherwise it will ‟take 200 years before the Swedish films in the archive’s collections will be digitized” (Wengström, 2013). In short, it’s an organisational (and monetary) quest where one puts an archive’s resources (which are always constrained). Nevertheless, if one really wants to provide access one cannot perform large-scale high-quality digitisation. Most libraries learned this lesson more than a decade ago due to Google’s book scan project.
Doktorandkursen i mediehistoria – ett samarbete mellan Umeå och Lunds universitet – har haft sina tre sista föreläsningar vid Uppsala universitet. Passen handlade om bild och materialitet (gästföreläsning av Anna Dahlgren), informationshantering och arkiv (Johan Jarlbrink) samt min egen föreläsning om digitalisering. Slides från de tre föreläsningarna finns att ladda ned som PDF här: 7. mediehistoria_bild_materialitet 8. mediehistoria_informationshantering_arkiv 9. mediehistoria_digitalisering.
I dagens Västerbottens-Kuriren intervjuas jag om botar – något jag ägnat mig en del åt. Anders Wynne har skrivit en utmärkt artikel som inleds så här: “Det är många som söker uppmärksamhet i den digitala världen. Logiken säger att ju fler som klickar, följer och gil- lar, desto större chanser att få ännu större uppmärksamhet. – Man kan numera köpa sig falska följare. I marknadsföringssammanhang kommer det här mer och mer, säger Pelle Snickars, professor i medie- och kommunikationsvetenskap med inriktning mot digital humaniora vid Umeå universitet.” Artikeln ligger ännu inte ute online – men jag tar mig friheten att länka upp intervjun som pdf: vk_snickars_bots.
Idag startar MEG15 i Göteborg. Jag deltar imorgon i en panel om “A unified european copyright reform – will it add to creativity and culture?” Enligt programmet är det tänkt att handla om: “What are the opportunities, dangers and challenges of a new joint copyright reform for all of Europe? Discussion around the demand of a new copyright reform with the goal of enhancing cultural life and creativity in Europe.” Deltar gör bland andra Julia Reda, EU-parlamentets enda piratpartist. Jag ser fram emot ett intressant samtal.
Det är ansökningstider – och i likhet med många andra forskare har jag ägnat en del tid de senaste veckorna åt att författa dokument som potentiellt borde generera forskningsmedel. I år har jag arbetat med Tekniska museet, framför allt med avdelningschefen Sofia Seifahrt och industrihistorikern Anders Houltz. Vår ansökan, riktad mot Vitterhetens utlysning av medel kring “Forskning och samlingarna”, utgörs av ett samarbete mellan museet och HUMlab vid mitt universitet. Titeln på det hela är: “Digitala Modeller. Teknikhistoriens samlingar, digital humaniora & industrialismens berättelser”. Ansökan är faktiskt en av de bättre jag skrivit och delar av den lyder som följer:
Ansökan syftar till att från tre olika kulturarvsperspektiv undersöka digitaliseringens specificitet och potential som brygga mellan forskning, minnesinstitution och besökare. De materialkategorier ur samlingarna som valts ut för att digitaliseras och beforskas är alla relaterade till industrialismens olika faser och berättelser. Men ansökan tar också fasta på att finansiärerna efterlyser projekt med ”betoning på digitaliseringens möjligheter och effekter för forskningen och arbetet vid minnesinstitutionerna”. Den underliggande projektidén är att ABM-institutioner inte bara bör ägna sig åt att digitalisera sina samlingar, utan också göra det möjligt för forskare och besökare att använda – till och med spela – digitalt kulturarv genom olika slags applikationer, verktyg och programvaror.
Utgångspunkten är tre valda materialkategorier i museets samlingar vilka på olika sätt speglar industrialiseringens tre faser. Projektet tillämpar härvidlag tre metodologiska infallsvinklar: traditionell digitalisering (A.), massdigitalisering (B.) och kritisk digitalisering (C.). Digitaliseringssätten korresponderar dels med skilda teknikhistoriska perioder (med specifika frågeställningar), dels med olika digitala metoder för att arbeta med det inskannade materialet. De olika metodmässiga ingångarna kommer att resultera i tre uppsättningar av digitala redskap och spelprototyper presenterade på Tekniska museets hemsida – och i förlängningen även i en utställning – för att berätta om industrialismens olika faser.
I takt med att allt mer historiskt material digitaliseras på minnesinstitutioner har insikten vuxit fram att all data som digitaliseringen resulterar i inte längre kan (eller bör) beforskas på traditionella humanistiska sätt. Som forskningspraktik innefattar digital humaniora ofta utveckling av nya digitala metoder, vilka förutsätter programmeringskunskaper och tvärvetenskapligt samarbete. De arkiv som digitalisering resulterar i är dessutom fundamentalt annorlunda än traditionella arkiv, eftersom alla filer besitter inherent data som kan analyseras på nya och annorlunda sätt. Projektet är metodmässigt originellt. Dels är syftet att digitalisera tre materialkategorier på Tekniska museet av intresse för den teknikhistoriska forskningen: (A.) delar av företagsledaren och industrihistorikern Carl Sahlins (1861-1943) omfattande (och för museet centrala) samling, (B.) samtliga årgångar av årsboken, Dædalus (1931-2014) som museet har rättigheterna till, samt (C.) 31 modeller ur Christopher Polhems mekaniska alfabet från 1700-talets början. Dessa tre materialkategorier korresponderar på ett generellt plan mot industrialismens tre faser (Isacson, 2002): industrialismens genombrott (Sahlin), massproduktion (Dædalus) samt datorisering (Polhem skannad/printad i 3D). Digitala metoder innebär att tänka med och förstå den mjukvara, och de applikationer och protokoll som idag hanterar nya (och äldre) medier, t ex de sätt som analoga medier digitaliseras på och vilka forskningsmöjligheter som då uppstår (Rogers, 2013). Ansökan är därför inskriven i en metodmässig kappa som på ett metaplan tematiserar vad samlingarna och forskningen har för olika relationer i takt med att kulturarvet digitaliseras.
Digitaliseringen av Sahlins samling (A.) innebär att delar av materialet görs sökbart genom indexering, katalogisering och inmatning av metadata. Urvalet koncentreras till topografiskt material (gruvkartor, industriföremål, skisser av hyttor etcetera) och kommer att presenteras på nätet. Delar av Sahlins fotografisamling är därtill tänkt att analyseras med hjälp av programvara hämtad från ”cultural analytics” (Manovich, 2011) där bildmaterial betraktas som ett stort kulturellt dataset. Ansökans andra teknikhistoriska inriktning görs i massdigitaliseringens tecken (B.); samtliga nummer av årsboken Dædalus mellan 1931 och 2014 kommer att skannas och OCR-läsas, inalles c:a 15 000 sidor. Kritisk digitalisering (C.) utgör en tredje teknikhistorisk ingång med fokus på Christopher Polhems mekaniska alfabet. 31 bevarade originalmodeller kommer att 3D-skannas och 3D-printas. Kritisk digitalisering är ett textorienterat begrepp lanserat av Dahlström (2009), med släktskap till filologisk och historisk-kritisk textutgivning. Här används begreppet metodologiskt för att särskilja olika digitaliseringsstrategier. Ambitionen är att med hjälp av 3D-visualisering/print bygga detaljerade digitala modeller av Polhems original. Dess rörelseomvandlingar kan därefter ingående studeras och återuppbyggas digitalt – eller skrivas ut.
Doktorandkursen i mediehistoria i samarbete mellan Umeå och Lunds universitet tuffar på. På grund av sjukdom kunde jag själv inte delta i veckan – men de tre passen då handlade om medier och minne (gästföreläsning av Marie Cronqvist), kulturtekniker (Johan Jarlbrink) och mediesystem (Patrik Lundell). De tre föreläsningarna (i lite olika form) finns att ladda ned som PDF här: 4. medier_minne 5. kulturtekniker 6. mediesystem.
It is with pleasure that I received the news that my long paper proposal for the Digital Humanities conference in Sydney during summer 2015 has been accepted. Fierce competiton apparently – five reviewers for each long paper proposal; 75 such papers accepted with an overall acceptance rate of 52 percent of submissions. Anyway, nice to be on board – my proposal entitled “Record Label Set Up” runs as follows:
Within a short space of time, ways of listening to new (and older) music have rapidly changed. If visions of a celestial jukebox two decades ago promised music in the cloud for everyone—this is now a reality, with Sweden’s Spotify as one of the foremost examples of the music industry’s technological transformation. The digital download model, however, still remains a key revenue stream. Yet subscription and ad-supported streaming services have grown from ten to almost 30 percent of digital revenues in the last five years. As stated in the latest IFPI Digital Music Report 2014, ”it is now clear that music streaming and subscription is a mainstream model for our business. In 2011, there were eight million paying subscribers to subscription services—today there are 28 million.” In the report, especially the Scandinavian countries are said to be a showcase of music industry revival—where Spotify has a total dominance—demonstrating the ”regenerating potential of the streaming model.” Rediscovering older music is a key concept for Spotify, and the company has worked fiercly with constantly expanding and upgrading its catalogue. Spotify thus poses a number of challenges to traditional ways of handling music heritage—especially with regards to the ALM-sector (archives, libraries and museums). Seamless access to music has simply led to alternative usage patterns, new forms of engagement and the popularisation of older musical forms in ways that traditional cultural heritage institutions can never replicate. In short—when streaming heritage becomes a fact, what is the (new) cultural role of heritage institutions?
My presentation takes the form of a first report of a new research project, ”Streaming Heritage. Following Files In Digital Music Distribution”. The project is financed by the Swedish Research Council—with approximately one million euro—and involves five researchers working in an interdisciplinary research team. The project is situated at HUMlab (Umeå university) and will run between 2014 and 2018. On a general level, the purpose of the project is to study emerging streaming media cultures, and the music service Spotify in particular, with a bearing on the digital challenges posed by direct access to musical heritage for memory institutions. However, the purpose is also both web historical and contemporary. On the one hand, this so called”Spotify-project” will track the development of online music cultures, from file sharing at Napster and The Pirate Bay to legal streaming services as Spotify. On the other hand, it will follow files in digital music distribution by way of digital ethnographic methods. Research is, in short, conducted and based on the creation of a non-profit record label in order to study unexpected file ’behavior’. Programmers from HUMlab are involved in the research process. The record company acts as an innovative research tool, with the aim of following—or simply pursuing—digital music files throughout the intra-digital distribution process: from creation, via aggregation, and through to playback. Using various digital methods the ambition is to observe the files’ journey through the digital ecosystem—streaming media culture’s black box—normally not accessible to traditional media researchers. The basic idea is that digital (or digitized) media objects has changed the way in which they should be conceptualised, analysed and understood—not the least from a heritage perspective. That is, a movement from studying static music artifacts to an increased scientific focus on dynamically active files with a kind of inherent information about factors such as broadband infrastructure, file distribution and aggregation, user practices, click frequency, social playlists, sharing and repetition. During autumn 2014 we have initiated and started our record label, and via the aggregator RouteNote—”a free way to get your music onto the world’s leading stores and distributors”—begun to track ”our music files”. Research results will follow.
Den doktorandkurs på Umeå och Lunds universitet, som jag ger i samarbete med Patrik Lundell och Johan Jarlbrink, har satt igång. De inledande passen har handlat om kulturhistorisk medieforskning, om mediearkeologi och om vetenskapens mediehistoria. De tre första föreläsningarna (i lite olika form) finns att ladda ned som PDF här: 1. kulturhistorisk medieforskning 2. mediearkeologi 3. vetenskapens mediehistoria
Joachim Sundell på SVT Kulturnyheter har skrivit ett reportage om The Pirate Bay, apropå att sajten blir allt egendomligare: “Piratskeppet går mot mörkare vatten“. Jag och flera kollegor uttalar sig. “Pirate Bay återuppstår – men idealismen är död. När fildelningssajten återvänder är det med större vinstintresse och mindre ideologi, menar flera experter.”
Tillsammans med min kollega Johan Jarlbrink arbetar jag för närvarande på en artikel inom ramen för forskningsprojektet Digitala lägg. Om pressens gränssnitt 1800. Arbetstiteln är “Maskinläsning” och vi tänker oss en möjlig publikation framöver i Nordicoms medietidskrift. Artikeln tar i nuvarande skick sin början så här:
Hösten 2014 samlades ett sjuttiotal bibliotekarier, forskare, byråkrater och representanter för tidningsbranschen på British Library i London för en konferens om digitalisering av äldre dagspress inom ramen för kulturarvsportalen Europeana. Projektet Europeana Newspapers har haft ambitionen att digitalisera 18 miljoner tidningssidor, varav drygt hälften kommer att vara sökbara i fulltext genom så kallad ”optisk teckenigenkänning” när projektet är avslutat. Just OCR, ”Optical Character Recognition”, var ett av konferensen mest omdiskuterade teman. Det är inte förvånande eftersom OCR på flera sätt är den teknik som gör digitaliserad dagspress till en helt ny typ av forskningsmaterial. OCR konverterar dagspressen som medium – från tidning till maskintext – genom en närmast cirkulär textuell migreringsprocess där tidningssida blir inskannad bild, vilken därefter omkodas till maskinläsbar text. Ur den senare kan dels genereras inherent data, extrapolerad ur det inskannade materialet, dels möjliggör den maskinkodade texten storskaliga kvantitativa analyser av exempelvis ords samförekomster.
Samtidigt är OCR-tekniken fortsatt behäftad med problem, vilket London-konferensen gav besked om. Har vi nått ”peak OCR” var det flera deltagare som undrade. Särskilt tröstlöst tycktes läget vara i länder där frakturstilen dominerat. 1930 publicerades exempelvis fortfarande omkring 60 procent av alla trycksaker i Tyskland i fraktur, och frakturstilen var även vanlig i Sverige fram till 1800-talets slut. Men även den latinska tryckstilen, antikva, orsakar fortsatt igenkänningsproblem menade andra. Det marknadsledande företaget ProQuest, och deras inskanning av 472 brittiska tidskrifter mellan 1681 och sent 1930-tal, ger exempelvis fantastisk access till ett omfattande källmaterial, och samtidigt har forskare påpekat att till och med ProQuest sofistikerade OCR-algoritmer fortsatt inte riktigt går att lita på. I en genomgång av viktorianska influenser på Kuba i det inskannade brittiska tidskriftsmaterialet har Albert D. Pionke bland annat visat på betydande svårigheter för Proquests algoritmer att urskilja ordet”Cuba” från ord som: ”cash”, ”Cheap”, ”Cheapest”, ”Colours”, ”cube”, ”Curacies”, ”curator” eller ”cure” (Pionke, 2014: 391). Det säger sig självt att sådana ”bad matches” kan leda till felaktiga slutsatser och forskningsresultat.
Den här artikeln handlar om digitaliserad (och maskinläsbar) äldre svensk dagspress och de möjligheter som nya digitala metoder ger den mediehistoriska forskningen. Utifrån en mediehistorisk infallsvinkel uppmärksammar artikeln den digitala teknikens möjligheter att på ett generellt plan analysera stora textmängder på jakt efter lingvistiska mönster, bland annat genom så kallad ”distant reading”, en sorts data-metodologisk distansläsning av tiotusentals inskannade böcker som utvecklats av litteraturvetaren Franco Moretti med fokus på 1800-talets skönlitteratur (Moretti, 2013). Samtidigt pläderar artikeln för en mediehistorisk specifik analys, där man som forskare inte bör reducera gamla tidningar till enbart en samling text: bilder, layout, annonsers placering på sidan etcetera är samtliga också delar av det som vi kallar en tidning.
Ingen forskare kan emellertid läsa hela 1800-talets svenska press – enbart datorer. Digitala metoders forskningspotential är därför betydande, om så i form av ”topic modeling”, ”macroanalyses”, ”pattern recognition”, ”cultural analytics” eller andra former av algoritmiska användningsområden för analys av stora kulturella dataset som den digitaliserad dagspressen utgör. Vår artikel väjer dock inte för de problem (och ofta bristfälliga resultat) som den mediehistoriska forskningen än så länge uppvisar på området. Med andra ord handlar det om att uppmärksamma en i allra högsta grad aktuell forskningsdialektik där digitala metoder dels innebär betydande möjligheter för medieforskningen, dels att förhålla sig kritiskt till resultat de genererar.