Cases, Onderzoek, Strategie, Trends

Ober? Er zit big data in mijn gehaktbal

0

Een kleine week nadat bekend werd dat ook in de Zweedse balletjes van de IKEA Roemeense paarden zitten, kwam technologieblog Venturebeat met een artikeltje over big data en de mogelijkheden op het gebied van voedselkwaliteit. Met genoeg data en de juiste tools om ze te analyseren zouden problemen zoals bij de IKEA in de toekomst voorkomen kunnen worden.

Big data als wondermiddel

Het was een goed voorbeeld van de manier waarop big data momenteel veelal wordt neergezet als een wondermiddel voor alles wat niet goed gaat of beter zou kunnen. Grote beloften die passen bij een containerbegrip van formaat. Maar hoe zorgen we dat de potentie van beter gebruik van data ook daadwerkelijk wordt benut? Hoe we stimuleren datagedreven innovatie? En hoe beperken we mogelijke nadelige gevolgen?

IBM

Terug naar big data en het paardenvlees. In het artikel van Venture Beat wordt de technologie van IBM aangehaald: “IBM brings ‘big data’ tech to food to prevent the next horse meat scandal.” Hoewel het Amerikaanse concern zich genoodzaakt voelde om met een ingezonden verklaring deze kop te nuanceren – men was niet in staat om daadwerkelijk paardenvlees te detecteren, daar was een DNA-test voor nodig – was het niet te beroerd om het artikel met een tweet wat extra aandacht te geven.

big data

Een sterke positie in de big data-markt veroveren

Net als veel andere partijen zoals Google, Microsoft, Cisco en vele nieuwkomers zoals Cloudera, Splunk en Gnip probeert IBM een sterke positie in de (big) data-markt te veroveren. Dat is niet zo verwonderlijk, want steeds meer organisaties, van app-ontwikkelaars tot agrarische bedrijven, leunen sterk en in toenemende mate op het gebruik van data.

“[…] We’re entering the era of products that are built on data,” – O’Reilly Radar Team (2011).

Nu data, net als eerder de PC en het web, een infrastructuur vormen – of eigenlijk een infostructuur – waar nieuwe diensten op ontwikkeld kunnen worden, is de dans voor een mooie positie (met de juiste propositie) in het ecosysteem van datacollectie, -opslag, -analyse en -output in volle gang.

Van ‘quick wins’ naar echte innovatie

Aan aandacht voor big data geen gebrek. Sterker nog, om overzicht te hebben van het aantal big data-congressen, -workshops, -rapporten en -artikelen, heb je in feite diezelfde big data-technologieën nodig. Wat echter opvalt aan de discussies hierover is dat de focus vaak gericht is op effectievere marketing, bijvoorbeeld op basis van sociale media, de inrichting van efficiëntere productieprocessen of betere besluitvorming. En dat is jammer.

Hoewel dit absoluut waardevolle innovaties zijn, zijn het ook de quick wins. De inzet van big data blijft daarmee zeer instrumenteel. In feite blijft alles bij hetzelfde, alleen net iets ‘er’, iets snell-er, iets efficiënt-er en iets goedkop-er. De potentiële, vernieuwende mogelijkheden van deze technologische ontwikkelingen blijven daarmee vooralsnog onbenut.

Nike heeft big data omarmd

Er zijn nog maar weinig bedrijven die zichzelf opnieuw uitvinden als producent van een dataproduct en daarbij hun propositie vanuit een dataperspectief benaderen. Een interessante uitzondering is de ontwikkeling bij Nike. Het Amerikaanse sportmerk heeft data omarmd en is daarbij verder gegaan dan het verbeteren van het fysieke product. Nike helpt – van origine met schoenen, broekjes en shirtjes – mensen om te sporten en actief bezig te zijn.

Maar de laatste jaren, met de ontwikkeling van een app en een online platform (Nike +) is de rol van data en data-analyse in die propositie steeds groter geworden. En sinds kort heeft men daar met de Fuelband, die gebruikers inzicht verschaft in hun activiteiten, een volgende sprong genomen. De kern van Nike is met dit product is nog steeds hetzelfde, maar de manier waarop het wordt aangeboden is aan de hand van data veranderd.

Een heel ander voorbeeld is de John Deere-tractor die door middel van sensoren in de machines in staat is om data over de grond en de gewassen te verzamelen en te analyseren. Op die manier kan het bedrijf voorspellingen doen die waardevol zijn voor de hele sector, waardevolle informatie die veel geld waard is.

Oog voor de transformatieve kansen aan de horizon

Nu is het niet verwonderlijk dat veel bedrijven zich in eerste instantie tegoed doen aan de vitaminen van het laaghangende fruit. Maar tegelijkertijd is het belangrijk om een strategie te ontwikkelen waarbij men, afhankelijk van de volwassenheid van de organisatie en de omgeving, met eerste (kleine) stappen kan beginnen, maar tegelijkertijd oog heeft voor de transformatieve kansen aan de horizon.

Het is cruciaal –  niet alleen voor bedrijven, maar ook bij de aanpak van maatschappelijke vraagstukken –  om te onderzoeken hoe enorme hoeveelheden data en slimme analyse en visualisatie technologieën ons in staat stellen om tot geheel nieuwe producten, nieuwe oplossingen en nieuwe structuren te komen. Met big data kunnen we broodnodige, systematische veranderingen realiseren – zoals de toenemende nadruk op preventie in de zorg, het idee van gepersonaliseerd en adaptief onderwijs, en decentrale energieopwekking en -distributie.

Risico’s van big data

big data privacyMaar het is niet alles goud wat in nullen en enen kan worden opgeslagen. Het is essentieel om ook stil te staan bij de risico’s van het gebruik van big data en verwante technologieën binnen een organisatie, nog los van gevaren van big data-ontwikkeling in het algemeen: zo is privacy een van de meest urgente issues en krijgt terecht veel aandacht.

Het gevaar

Het gevaar van big data ligt besloten in de combinatie van vier factoren:

  1. Het gebrekkige besef van de beperking van de gebruikte datasets en de context waarin data verzameld is. Wat wordt er bijvoorbeeld niet meegenomen in de data? Zo werd na orkaan Sandy gebruik gemaakt van Twitter om te bepalen waar behoefte was aan hulp. Op zich een hele slimme toepassing van social media, maar tegelijkertijd werden daarmee de mensen die niet in staat waren om te twitteren – de armste en zwaarst getroffen gebieden – niet meegenomen in de analyse.

    Perhaps the most dangerous is the technologist who never understands the limitations of data, never understands what data isn’t telling you, or never understands that if you ask the wrong questions, you’ll certainly get the wrong answers.”

  2. De uitdaging om ‘ruis’ van ‘signaal’ te onderscheiden bij het combineren van datasets waarin altijd wel correlaties te vinden zijn:

    Big data means anyone can find fake statistical relationships, since the spurious rises to the surface. This is because in large data sets, large deviations are vastly more attributable to variance (or noise) than to information (or signal).”

  3. De onzichtbare aannames en waarden die verwerkt zijn in algoritmen om de data te verwerken:

    “[…] Algorithms are created by people and they contain inferences and assumptions coded in. Those coded-in values shape the output — computer-generated predictions, recommendations and simulations. […] At some point you’re at the hand of the algorithm.”

  4. De schijnzekerheid die de grote aantallen van big data met zich meebrengen:

    You can fool yourself with data like you can’t with anything else. I fear a Big Data bubble.”

Je kunt ook flink de mist in gaan

Kortom: met big data kun je ook flink de mist in gaan. Niet voor niets pleit Katie Crawford van MIT voor een hybride benadering van big en ‘small’ data, waarbij enorme hoeveelheden kwantitatieve data gecombineerd worden met kwalitatieve data waarin juist aandacht is voor de context en het individu. Deze combinatie zorgt voor ‘driedimensionale’ inzichten, daar waar big data het risico loopt om zich in de diepte te verkijken door platgeslagen gemiddelden. Dit benadrukt eveneens het belang van de multidisciplinaire combinatie van big data en domeinkennis op macro- en microniveau.

Big data vraagt om een multidisciplinaire aanpak

Een zoektocht naar de inzet van big data is een aaneenschakeling van multidisciplinaire vragen. Allereerst in technologische zin: big data vraagt om kennis over onder andere infrastructuur, (verschillende vormen van) analytics, visualisatie, veiligheid en interoperabiliteit.

Maar dat is pas het begin. Want uiteindelijk krijgt big data pas betekenis in een specifieke context en dat vereist domeinkennis. De ontwikkeling en toepassing van algoritmen die nieuwe indicatoren voor borstkanker kunnen detecteren vragen om oncologische kennis. De ontwikkeling van ‘learning analytics’-toepassingen vraagt om didactische en psychologische kennis. De ontwikkeling van een slimme dijk vraagt om de kennis van civiele ingenieurs en geologen.

Er moet een specifieke vraag of behoefte zijn

Om gebruik te kunnen maken van big data moet er een specifieke vraag  of behoefte zijn waarna in een iteratief proces ‘data scientists’ en domeinexperts met veel (verschillende) datasets tot nieuwe inzichten, voorspellingen en oplossingen kunnen komen. Bovendien zouden ook ontwerpers waardevol in dit traject kunnen zijn, omdat zij in staat zijn om buiten bestaande oplossingen en processen te denken.

Vervolgens moet bij het gebruik van big data de aanverwante technologieën, technieken en inzichten in een organisatie (of zelfs verschillende organisaties) geïmplementeerd worden: nieuwe businessmodellen, nieuwe werkwijzen en daarmee mogelijk zelfs een nieuwe bedrijfscultuur. Volgens een studie van MIT Sloan Management, waarin 3000 bedrijven zijn ondervraagd, was deze uitdaging net zo groot als de technologische uitdagingen.

De verstrengeling met verschillende stakeholders neemt een vlucht

Tot slot spelen big data-vragen meestal niet in het vacuüm van een enkele organisatie, maar in het luchtruim van een complex data-ecosysteem met veel verschillende spelers en verschillende agenda’s en belangen. Naarmate de inzet van big data binnen een organisatie steeds strategischer wordt, en ook de samenwerking met externe partijen toeneemt, zal  de verstrengeling met verschillende stakeholders een vlucht nemen. Het wordt daarmee voor een organisatie steeds belangrijker om een goed beeld te verkrijgen van dit ecosysteem om zo de eigen strategie, positie en partners te kiezen.

Conclusie: dit is pas het begin

ikeaBig data is overal: in de zorg, transport en veiligheidsdiensten, in dataproducten zoals de Fuelband en binnenkort wellicht ook in de gehaktballen van de IKEA.

Het kan organisaties helpen (of dwingen) om zichzelf opnieuw uit te vinden. Het kan nieuwe, transformatieve oplossingen bieden voor maatschappelijke problemen.

In de praktijk wordt big data echter veelal gebruikt voor kleine, stapsgewijze aanpassingen, om datgene wat we nu doen net iets efficiënter te doen. Dat is niet verwonderlijk: dit is pas het begin. Maar het is belangrijk om een meer ambitieuze route uit te stippelen om met die kleine eerste stappen wel de goeie richting in te gaan. Dit betekent vanuit een kernvraag met een multidisciplinaire benadering zoeken naar echte innovaties, waarbij met een combinatie van big en small data de grootste risico’s vermeden kunnen worden.

Als we dat voor elkaar krijgen is verdwalen het ergste dat je bij de IKEA kan overkomen. Maar ook daar is in de vorm van een app al een handig dataproduct voor.