Maskinläsning. Om massdigitalisering, digitala metoder och svensk dagspress

Hösten 2014 samlades ett sjuttiotal bibliotekarier, forskare och representanter för tidningsbranschen på British Library i London för en konferens om digitalisering av äldre dagspress inom ramen för kulturarvsportalen Europeana. ’Europeana Newspapers’ har ambitionen att digitalisera 18 miljoner tidningssidor, varav drygt hälften ska vara sökbara i fulltext genom så kallad ’optisk teckenigenkänning’. Just OCR, ’Optical Character Recognition’, var ett av konferensen mest omdiskuterade teman. Det är inte förvånande eftersom OCR på flera sätt är den teknik som gör digitaliserad dagspress till en helt ny typ av forskningsmaterial.


“Maskinläsning. Om massdigitalisering, digitala metoder och svensk dagspress” (skriven tillsammans med Johan Jarlbrink & Christian Colliander), Nordicom Information, vol 38, no 3, 2016.

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *