Aan de slag met big data: zo maak je er chocola van
De sensoren die BP in 650 oliebronnen heeft geïnstalleerd, spugen ieder kwartier een half miljoen metingen uit. Hoeveel olie er uit een bron komt, hoeveel zoet water erin gespoten wordt, hoe vol allerlei opslagtanks zitten, hoe zout het grondwater is, welke apparaten er gaan sputteren… Alles om data-analisten te helpen voorspellen hoeveel olie er nog in de bron zit en daar het laatste druppeltje olie uit te halen. De vraag is hoe je daar chocola van maakt en er de marktkansen in herkent. Hoe kun je zelf aan de slag gaan met big data?
1. Big data moet ‘small’ beginnen.
Start met kleine beetjes data en koppel die met andere beetjes data van jezelf, van je concurrenten of van de overheid. Mijn klanten denken vaak dat een big data-analyse groots, meeslepend en hoogdravend moet zijn. Mis. De beste remedie tegen information overload is zorgen dat je niet teveel informatie hebt.
Duik bijvoorbeeld in de NAW-gegevens van je klanten en turf op een postcodekaart waar ze wonen. Kijk in welke postcodes je veel turfjes hebt. Leg vervolgens een ‘lifestyle-per-postcode-kaart’ over je geturfde verkoopkaart heen. Dan weet je bij welk soort lifestyle jouw product bovengemiddeld aanslaat. Nu is lifestyle maar één van de kenmerken waarop je een postcode kunt indelen. Schoenmaat, favoriete voetbalclub en aantal huisdieren zijn andere voorbeelden. Maar lifestyle is toch wel een belangrijke.
Het BSR-model
In mijn eigen bedrijf gebruiken we vaak (maar niet altijd) het BSR-model. Daarin krijgen alle Nederlandse postcodes een kleurtje op basis van de overheersende gewoontes, (merk)voorkeuren en lifestylegegevens. In postcodes waar je (nog) niets verkocht hebt, maar die een vergelijkbaar lifestyleprofiel hebben, kun je vervolgens gerust een billboard voor jouw product neerzetten. Als je toevallig de BSR-kleurenkaart gebruikt, weet je bovendien meteen welke andere merken ‘jouw soort mensen’ veel gebruikt, en dus ook met welk merk je een gezamenlijke actie kunt opstarten. Zonder dure merkattitudepeilingen, interessevergelijkingen of opiniepanels.
2. Duik niet ongericht je data in. Toets je onderbuikgevoel.
Duik niet ongericht je data in. Dat is een van de grootste fouten die beginnend big data-analisten maken. Ze ploeteren door gigabytes aan data op zoek naar trends en correlaties. Die mensen verzanden in details, zien grote lijnen over het hoofd en moeten bij hun eindejaarsgesprek uitleggen waarom er geen doorbraken zijn behaald. Het werkt beter om anekdotische ervaringen op te doen en die te staven met de beschikbare data. Dan weet je namelijk naar welke ‘speld-in-de-datahooiberg’ je zoekt.
McDonalds als voorbeeld
Stel, je bent de baas van McDonalds. Ga daar elke week een dag zitten. Misschien merk je wel dat de vaders van gezinnen snel hun keuze hebben gemaakt en dat kinderen snel een Happy Meal kiezen, maar dat vrouwen meer tijd nodig hebben om iets uit te zoeken. Waar zou ‘m dat in zitten?
Thuis aangekomen duik je in de data: je maakt een selectie van alle orders die bestaan uit twee Happy Meals en twee volwassenenmenu’s. Dan weet je vrij zeker dat je gezinnen te pakken hebt. Vervolgens kijk je waar het ‘volwassenencomponent’ van de order uit bestaat. Veel Big Tasty’s, Quarter Pounders en Big Macs ongetwijfeld, en wellicht een behoorlijk groot deel salades en cola light. Zouden die vrouwen voorkeur hebben voor slankere keuzes?
Misschien houdt McDonalds wel van iedere bestelling bij hoe lang deze heeft geduurd. In dat geval kun je zelfs vergelijken of er in de langzame gezinsbestellingen vaker salades zitten dan in de snellere bestellingen. Zijn die soms moeilijker te vinden? Of nemen vrouwen na twijfelen dan maar genoegen met een salade? Stel dat hier een verband zit, dan is het bestelproces wellicht te versnellen door enerzijds op de borden de calorieën bij de bewustere keuzes af te drukken en anderzijds meer slanke keuzes aan te bieden.
Experimenteren is belangrijk
Met andere woorden: werk vanuit een trigger via data naar een kans toe en ga dan gerust eens experimenteren. Die triggers (events, gedachtes, opvallende waarnemingen) vormen het startpunt. Na het experimenteren moet je dan wel zorgen voor snelle feedback, zodat de data ook antwoorden gaan geven.
3. Kijk naar de uitschieters. Niet de gemiddelden.
Deze tip is conceptueler, maar ik herken ‘m in onze beste big data-onderzoekers. Ze kijken niet alleen naar de gemiddelden, maar juist ook naar de uitschieters. De uitschieters geven juist betekenis aan het totaal.
Stel dat je sterftecijfers en klanttevredenheidscijfers van Nederlandse ziekenhuizen in een spreidingsdiagram zet. Dan is het leuk om te weten dat het gemiddelde ziekenhuis een zevenkommanogwat scoort, en een sterftecijfer heeft van X. Maar de écht interessante data zitten hier eigenlijk in de ziekenhuizen met extreem lage sterftecijfers en extreem hoge klanttevredenheidscijfers. Dat kan liggen aan het specialisme van het ziekenhuis, maar ook pareltjes die vallen te wijten aan oprechte best practices. Dit voorbeeld hadden wij recent aan de hand van de zorgkaart. Een boeiende case waar we vervolgens een mooie discussie met de ziekenhuisdirectie over konden hebben.
Kortom, verras je klant met nieuwe inzichten, en die zitten steeds vaker in de afwijking!
Afbeeldingen met dank aan Fotolia