Krijgen we last van Digitale Alzheimer?

5

Door van Logica

Print

op maandag 21 juli 2008 om 11:47 uur

Opgraving middeleeuwse restenRecent was ik op zoek naar een programmaatje wat een jaartje of 8 geleden ontwikkeld is door (toen nog) CMG voor de euro conversie. Het programma EuroCross converteert een gulden bedrag onder de cursor naar het equivalent in euro’s. Het is nergens op het internet meer te vinden. Er zijn in de tijd misschien wel een miljoen exemplaren verkocht (en ik had het zelf ook), maar het is weg. Het is me wel vaker over komen, je zoekt iets op het internet waarvan je weet dat het er moet zijn want een jaar geleden stond het er nog. Is onze eigen digitale historie wel op orde?

Laatst was er weer zo’n stukje over een opgraving op tv. Bij bouwwerkzaamheden stuitte men op overblijfselen van eeuwen geleden die het beeld hoe het leven vroeger was weer een stukje completer maakte. Zonder deze overblijfselen zouden we maar moeten gokken hoe het leven vroeger was. Weten we meer van honderden jaren geleden dan van 15 jaar geleden?

Donkere middeleeuwen van het Internet

Wie weet nog hoe de eerste internet pagina’s eruit zagen? Hoe het was om met Mosaic, Gopher en zelfs Netscape het Internet te surfen (toen werd het nog met een Hoofdletter I geschreven). Deze dingen komen tenslotte uit de donkere middeleeuwen van het Internet, 1993 om precies te zijn.

Is dit onze toekomst?  Raken we steeds meer informatie kwijt en krijgen we digitale rommelmarkten waar je die oude 2e hands bestanden kunt kopen voor een prikkie?

Digitale Alzheimer

Een recent artikel in de NY Times noemt het fenomeen dat we informatie kwijtraken Digitale Alzheimer! Wat staat er toch op die oude diskettes ? Als je nu een 5.25” disk hebt, weet je nog wat er op staat en kan je de data er dan nog vanaf halen. Data op magnetische dragers en zelfs op CD/DVD wordt onder invloed van licht en lucht aangetast. Je zult toch echt wel moeite moeten doen om dit nog in te lezen. Het fysieke formaat en de kwaliteit is dan de eerste hobbel. Je zult maar een tekst bestand hebben in Wordstar 2000, Ami Pro of Write IT, zie dat dan nog maar eens ergens in in te lezen. Nu zal dit nog wel meevallen want dit zijn toch min of meer bekende formaten.

Is de informatie die erop staat dan nog wel interessant? Misschien niet voor iedereen maar voor jezelf, familie, vrienden en in sommige gevallen een biograaf kan het toch interessant zijn om te lezen. Historici kunnen op basis van opgeslagen digitale informatie een beeld krijgen over de ‘tijdgeest’. Trouwens niet alleen lezen van documenten en,  heel belangrijke mail,  maar ook bekijken in het geval van digitale foto’s en video’s.

Groei van digitale content

Hierbij kom ik gelijk op een ander punt: we maken en krijgen steeds meer digitale content. Het steeds grote aantal pixels levert foto’s op van enkele MBs per stuk. Van mijn zoon Julian heb ik denk ik zo’n 8 GB aan foto’s op harde schijf staan. Gelukkig is ook de opslagcapaciteit steeds goedkoper. Voor 100 euro heb je nu al een 500 GB harde schijf waar een behoorlijke hoeveelheid foto’s, email enzovoort kunt opslaan. Online heb je die mogelijkheid zelfs gratis , zij het bescheidener in de vorm van Xdrive en Gmail.

IDC verwacht dat in 2011 er 10 x meer digitale data is dan in 2006. En dat is heel veel data, zelfs als opslag goedkoop is. Iemand moet betalen voor de opslag van al die data, bij Google komt dat uit advertenties maar wie weet hoe lang dat een houdbaar model is. Het feit dat alles wat Google doet in goud veranderd blijft waarschijnlijk niet in stand, zoals dat ook gold voor Microsoft, IBM en een hele hoop andere bedrijven.

Keuzes maken

Je moet dus keuze maken wat je wilt opslaan en wat niet. Naast het opslaan als individu wordt er ook van overheidswege en door bijvoorbeeld de Koninklijke Bibliotheek steeds meer aandacht besteed aan digitale preservatie. Natuurlijk is niet alles belangrijk om te bewaren. Trouwens, opslaan is een ander iets dan preserveren. Het laatste gaat er vanuit dat data altijd toegankelijk zal zijn. Iets waar een boek met een simpele interface (openslaan is genoeg) minder last van heeft. Of toch wel? Wie wel eens geprobeerd heeft Middeleeuwse boeken te ontcijferen heeft eigenlijk last van het zelfde probleem als iemand met een AMI Pro document en Office 2007, het is een andere versie!  Klik op onderstaande afbeelding om door het Bout handschrift te bladeren.

Flash applicatie van het Bout Handschrift (Koninklijke Bibliotheek)

Daarnaast is papier en film ook vergankelijk en wordt juist dit ook weer omgezet in digitale formaten. Het is wel van belang dat papier en film dat wordt omgezet naar een digitaal formaat dat toekomst vast is, anders hebben we prachtige digitale kopieën die vervolgens door niemand meer leesbaar zijn.

Open bestandsformaten en betere zoekmogelijkheden

Naast generieke en open bestandsformaten (in bijvoorbeeld RDF en OWL) en emulatoren die de werking van programma’s nabootsen zit er ook een hoop werk nog in het vinden en annoteren van metadata. Zonder metadata, bijvoorkeur geautomatiseerd uit bestanden gehaald is een data verzameling veel minder waardevol. Getty Images heeft miljoenen foto’s maar zonder haar fijn mazige beschrijving op meer dan 50 karakteristieken (zoals man, 60-65 jr, buiten, zon , boom, blauwe trui) is er eigenlijk niets in te vinden behalve dan door puur geluk.

Opslagmogelijkheden

Is er dan helemaal geen opslag van onze data? Ja hoor, ABN AMRO heeft al jaren een digitale kluis voor al uw digitale waardevolle zaken, we maken zelf thuis back-ups en er wordt zelfs structureel door het internet archief Archive.org kopieën van miljarden paginas (WaybackMachine) gemaakt maar doet dat eigenlijk alleen aan de ‘oppervlakte’, heel veel data die daar achter zit wordt niet gevangen. En daarmee mis je een hoop data, van banaal tot subliem.

Maar alle activiteit is gefragmenteerd, en zoals wel vaker wordt het missen van de data pas echt gevoeld bij een harddisk crash of gestolen pc. De foto’s op de pc zijn weg en blijven weg. Soms is een gedeelte nog wel ergens bij familie of vrienden te vinden maar sommige dingen blijven weg. En dat kan heel pijnlijk zijn als je alle foto’s van je familie of vrienden kwijt bent.

Hoe realistisch is Digitale Alzheimer nu eigenlijk?

Als ik naar mijzelf kijk, is het terugvinden van een bestand waarvan ik zeker weet dat er heel veel in Nederland zijn verkocht (en ik er zelf ook een van had) bleek al niet mogelijk. Ook rapporten en presentaties die ik heb gemaakt kan ik niet altijd meer terugvinden. Van een aantal van mijn Trendwatch rapporten zijn de enige versies die zijn overgebleven … die in boekvorm!

De rol van de overheid

Op een hoger niveau, namelijk dat van bibliotheken en door de overheid gesponsorde initiatieven zullen in de komende jaren nog vele projecten wereldwijd ontstaan waarmee we ons in de toekomst nog meer zullen kunnen herinneren van wat er nu aan de gang is.

Wat ga ik zelf doen?

Ik ga in ieder geval mijn backups structuren en zorgen dat mijn digitale waardevolle zaken veilig en toegankelijk blijven, bijvoorbeeld door ze op te slaan bij mijn bank.

Misschien leest iemand over 50 jaar dit artikel zelfs nog wel en denkt “dat had Rob goed gezien”.

Rob BlaauboerRob Blaauboer is Principal innovatie consultant bij Logica.

Meer over deze auteur: profiel, website

  1. Christian van blogspot.com op 21 juli 2008 om 13:59 uur

    Nog een bijkomend probleem: van bepaalde documenten (tekstbestanden, foto’s, databases enzovoort), vooral die met (verantwoordings)informatie, met een functie op het vlak van recht en bewijs, moeten de authenticiteit en betrouwbaarheid altijd worden bewaakt en kunnen worden gegarandeerd.

    In het archiefwezen is dit een ‘hot topic’. Een veelgelezen en -geprezen rapport hierover is getiteld “Een dementerende overheid”, te downloaden van de website van de Erfgoedinspectie: http://www.erfgoedinspectie.nl/page/archieven/publication?id=14

    “De afgelopen jaren heeft de Erfgoedinspectie onderzoek gedaan naar de ‘state of the art’ van het beheer van digitale (verantwoordings)informatie bij de centrale overheid. De bevindingen zijn vervat in het rapport ‘Een dementerende overheid? De risico’s van digitaal informatiebeheer bij de centrale overheid’. Het rapport beschrijft vanuit de praktijk de risico’s die de overheid loopt als zij haar informatie onzorgvuldig blijft beheren. Ook beschrijft het rapport de achtergronden van de problematiek en biedt het aanbevelingen ter verbetering.”

    In Nederland zijn gelukkig veel initiatieven om te komen tot digitale depots, bijvoorbeeld op het Nationaal Archief en het Gemeentearchief Rotterdam. Ook wordt veel gepubliceerd over dit onderwerp, ook in de media (zoals op deze blog).

  2. Sjors Timmer
    Sjors van svirsk.org op 21 juli 2008 om 21:09 uur

    Ik vind het ook wel weer iets moois hebben, dat zelfs digitale bestanden onderhevig zijn aan verval. De meeste gratis homepages die ik vroeger aanmaakte overtuigd door de belofte dat het levenslang gratis zou zijn (angelfire, geocities, fortune cities, lycos, iemand?) zijn al weer verdwenen. Net zo als ik veel kleur platen, eerste woordjes en zinnen die ik sprak al weer verdwenen zijn. Zo is het leven, en ‘vreemd’ genoeg blijkt het digitale web daar geen uitzondering op.

    Het is waar dat er nu veel meer data is, maar is de kwaliteit van de data dan ook gelijk beter, zijn 4000 digitale vakantie kiekjes van 100x meer waarde dan die 40 analoge kiekjes van 15 jaar geleden? Naar mijn gevoel begint het web steeds organiser te worden, en verdwijnt oude en niet meer gewenste data langzaam richting beerput. Gelukkig zijn er net zo als in het verdelen een paar excentriekelingen die zich met het opslaan bezig houden, en zolang die er maar zijn, gaat het vast allemaal wel goed komen.

  3. CFK van 12maandenblij.nl op 22 juli 2008 om 12:01 uur

    De gigantische snelheid van veranderen is dat waar we mee om moeten gaan. De veranderingen die ik heb meegemaakt (ik ben nu 39 lentes jong) heb ik uit mijn eigen synoptisch\analoge geheugen opgediept (en het was even graven):

    Computer:
    Zakjapanner -> Commodore 64 -> Tulip 8088 PC -> PC 80486 -> …. -> Dual Core

    Tekstverwerken:
    Basic -> wordstar -> WordPerfect -> Word 3 -> Word 2003

    Communiceren (zakelijk)
    Typen met doorslag -> geprinte circulaires -> pegasus mail -> Outlook mail -> Blog\smartphone\ -> ..

    De veranderingen hierboven zijn omgekeerd logaritmisch in snelheid en ook de “downwards compatibility” neemt logaritmisch af. Mijn eindscriptie van de HEAO (1991) wordt door Word niet meer begrepen.

    Wat je echt wilt bewaren, moet je jaarlijks opslaan in het nieuwste format. Tip voor de komende 6 maanden: PDF. Daarna zien we weer.

  4. Jeroen van blogspot.com op 15 september 2010 om 16:46 uur

    Dat is dan gelijk een pleidooi voor open bestandsformaten. Daardoor is ook over tientallen jaren door historici te reconstrueren wat voor tekst met grafische opsmuk er in een digitaal document staat.
    Closed source formaten zoals doc, docx, bepaalde vormen van pdf en dergelijke zijn eigenlijk ongeschikt. De overheid heeft zichzelf verplicht vanaf 2008 hiermee te werken, maar de werkelijkheid is zeer weerbarstig gebleken.
    Ikzelf werk nu alweer enkele jaren met odt van open office en dat bevalt prima en het format van dat bestand is openbaar en dus ook zelf weer na te bouwen.

  5. Digitaal Erfgoed Nederland: Naar Buiten! « Gadgets and Innovations van gadgetsandinnovations.com op 29 oktober 2010 om 21:34 uur

    [...] heb al eerder over digitaal erfgoed geschreven, het stuk over Digitale Alzheimer. Vanuit innovatie is het interessant te zien wat er wordt gedaan (en wat er nog zou kunnen worden [...]

Schrijf een reactie


Opmaak uitschakelen