Krijgen we last van Digitale Alzheimer?

0

Recent was ik op zoek naar een programmaatje wat een jaartje of 8 geleden ontwikkeld is door (toen nog) CMG voor de euro conversie. Het programma EuroCross converteert een gulden bedrag onder de cursor naar het equivalent in euro’s. Het is nergens op het internet meer te vinden. Er zijn in de tijd misschien wel een miljoen exemplaren verkocht (en ik had het zelf ook), maar het is weg. Het is me wel vaker over komen, je zoekt iets op het internet waarvan je weet dat het er moet zijn want een jaar geleden stond het er nog. Is onze eigen digitale historie wel op orde?

Laatst was er weer zo’n stukje over een opgraving op tv. Bij bouwwerkzaamheden stuitte men op overblijfselen van eeuwen geleden die het beeld hoe het leven vroeger was weer een stukje completer maakte. Zonder deze overblijfselen zouden we maar moeten gokken hoe het leven vroeger was. Weten we meer van honderden jaren geleden dan van 15 jaar geleden?

Donkere middeleeuwen van het Internet

Wie weet nog hoe de eerste internet pagina’s eruit zagen? Hoe het was om met Mosaic, Gopher en zelfs Netscape het Internet te surfen (toen werd het nog met een Hoofdletter I geschreven). Deze dingen komen tenslotte uit de donkere middeleeuwen van het Internet, 1993 om precies te zijn.

Is dit onze toekomst?  Raken we steeds meer informatie kwijt en krijgen we digitale rommelmarkten waar je die oude 2e hands bestanden kunt kopen voor een prikkie?

Digitale Alzheimer

Een recent artikel in de NY Times noemt het fenomeen dat we informatie kwijtraken Digitale Alzheimer! Wat staat er toch op die oude diskettes ? Als je nu een 5.25” disk hebt, weet je nog wat er op staat en kan je de data er dan nog vanaf halen. Data op magnetische dragers en zelfs op CD/DVD wordt onder invloed van licht en lucht aangetast. Je zult toch echt wel moeite moeten doen om dit nog in te lezen. Het fysieke formaat en de kwaliteit is dan de eerste hobbel. Je zult maar een tekst bestand hebben in Wordstar 2000, Ami Pro of Write IT, zie dat dan nog maar eens ergens in in te lezen. Nu zal dit nog wel meevallen want dit zijn toch min of meer bekende formaten.

Is de informatie die erop staat dan nog wel interessant? Misschien niet voor iedereen maar voor jezelf, familie, vrienden en in sommige gevallen een biograaf kan het toch interessant zijn om te lezen. Historici kunnen op basis van opgeslagen digitale informatie een beeld krijgen over de ‘tijdgeest’. Trouwens niet alleen lezen van documenten en,  heel belangrijke mail,  maar ook bekijken in het geval van digitale foto’s en video’s.

Groei van digitale content

Hierbij kom ik gelijk op een ander punt: we maken en krijgen steeds meer digitale content. Het steeds grote aantal pixels levert foto’s op van enkele MBs per stuk. Van mijn zoon Julian heb ik denk ik zo’n 8 GB aan foto’s op harde schijf staan. Gelukkig is ook de opslagcapaciteit steeds goedkoper. Voor 100 euro heb je nu al een 500 GB harde schijf waar een behoorlijke hoeveelheid foto’s, email enzovoort kunt opslaan. Online heb je die mogelijkheid zelfs gratis , zij het bescheidener in de vorm van Xdrive en Gmail.

IDC verwacht dat in 2011 er 10 x meer digitale data is dan in 2006. En dat is heel veel data, zelfs als opslag goedkoop is. Iemand moet betalen voor de opslag van al die data, bij Google komt dat uit advertenties maar wie weet hoe lang dat een houdbaar model is. Het feit dat alles wat Google doet in goud veranderd blijft waarschijnlijk niet in stand, zoals dat ook gold voor Microsoft, IBM en een hele hoop andere bedrijven.

Keuzes maken

Je moet dus keuze maken wat je wilt opslaan en wat niet. Naast het opslaan als individu wordt er ook van overheidswege en door bijvoorbeeld de Koninklijke Bibliotheek steeds meer aandacht besteed aan digitale preservatie. Natuurlijk is niet alles belangrijk om te bewaren. Trouwens, opslaan is een ander iets dan preserveren. Het laatste gaat er vanuit dat data altijd toegankelijk zal zijn. Iets waar een boek met een simpele interface (openslaan is genoeg) minder last van heeft. Of toch wel? Wie wel eens geprobeerd heeft Middeleeuwse boeken te ontcijferen heeft eigenlijk last van het zelfde probleem als iemand met een AMI Pro document en Office 2007, het is een andere versie!  Klik op onderstaande afbeelding om door het Bout handschrift te bladeren.

Flash applicatie van het Bout Handschrift (Koninklijke Bibliotheek)

Daarnaast is papier en film ook vergankelijk en wordt juist dit ook weer omgezet in digitale formaten. Het is wel van belang dat papier en film dat wordt omgezet naar een digitaal formaat dat toekomst vast is, anders hebben we prachtige digitale kopieën die vervolgens door niemand meer leesbaar zijn.

Open bestandsformaten en betere zoekmogelijkheden

Naast generieke en open bestandsformaten (in bijvoorbeeld RDF en OWL) en emulatoren die de werking van programma’s nabootsen zit er ook een hoop werk nog in het vinden en annoteren van metadata. Zonder metadata, bijvoorkeur geautomatiseerd uit bestanden gehaald is een data verzameling veel minder waardevol. Getty Images heeft miljoenen foto’s maar zonder haar fijn mazige beschrijving op meer dan 50 karakteristieken (zoals man, 60-65 jr, buiten, zon , boom, blauwe trui) is er eigenlijk niets in te vinden behalve dan door puur geluk.

Opslagmogelijkheden

Is er dan helemaal geen opslag van onze data? Ja hoor, ABN AMRO heeft al jaren een digitale kluis voor al uw digitale waardevolle zaken, we maken zelf thuis back-ups en er wordt zelfs structureel door het internet archief Archive.org kopieën van miljarden paginas (WaybackMachine) gemaakt maar doet dat eigenlijk alleen aan de ‘oppervlakte’, heel veel data die daar achter zit wordt niet gevangen. En daarmee mis je een hoop data, van banaal tot subliem.

Maar alle activiteit is gefragmenteerd, en zoals wel vaker wordt het missen van de data pas echt gevoeld bij een harddisk crash of gestolen pc. De foto’s op de pc zijn weg en blijven weg. Soms is een gedeelte nog wel ergens bij familie of vrienden te vinden maar sommige dingen blijven weg. En dat kan heel pijnlijk zijn als je alle foto’s van je familie of vrienden kwijt bent.

Hoe realistisch is Digitale Alzheimer nu eigenlijk?

Als ik naar mijzelf kijk, is het terugvinden van een bestand waarvan ik zeker weet dat er heel veel in Nederland zijn verkocht (en ik er zelf ook een van had) bleek al niet mogelijk. Ook rapporten en presentaties die ik heb gemaakt kan ik niet altijd meer terugvinden. Van een aantal van mijn Trendwatch rapporten zijn de enige versies die zijn overgebleven … die in boekvorm!

De rol van de overheid

Op een hoger niveau, namelijk dat van bibliotheken en door de overheid gesponsorde initiatieven zullen in de komende jaren nog vele projecten wereldwijd ontstaan waarmee we ons in de toekomst nog meer zullen kunnen herinneren van wat er nu aan de gang is.

Wat ga ik zelf doen?

Ik ga in ieder geval mijn backups structuren en zorgen dat mijn digitale waardevolle zaken veilig en toegankelijk blijven, bijvoorbeeld door ze op te slaan bij mijn bank.

Misschien leest iemand over 50 jaar dit artikel zelfs nog wel en denkt “dat had Rob goed gezien”.