Data analytics

Voorkom dat je verdrinkt in een data-analyse [5 tips]

0

In de afgelopen jaren is er steeds meer nadruk komen te liggen op het verzamelen en analyseren van data. Met alle data die ruim voorhanden zijn, kun je je afvragen of marketeers het zich nog wel kunnen veroorloven om geen gebruik te maken data-analyse. Maar je raakt met al die cijfers al snel het overzicht kwijt. Wat kun je daartegen doen?

Als marketeer hangt je succes vaak af van de kleinste details in de totale klantreis. Het kennen van de consument van je product of dienst is de basis van je werk. De data die je nodig hebt om gericht te werk te gaan is doorgaans ruim voorhanden. Als je eenmaal de tools in huis hebt, is het uitvoeren van een goede analyse een kwestie van het combineren van de juiste data en daarmee een analyse draaien.

Maar marketeers zijn vaak terughoudend als het gaat om data-analyse. De drempel om te starten lijkt vaak hoger dan deze daadwerkelijk is. De crux zit hem in hoe je uit die analyses op een heldere manier inzichten haalt waar je vervolgens acties op kunt ondernemen. Want een analyse kan interessante cijfers opleveren, maar als je daarna alsnog naar een onduidelijke grafiek moet kijken en op basis daarvan je beslissingen moet maken, schiet je er nog niet veel mee op.

5 tips die helpen bij het trekken van conclusies uit een data-analyse

In dit artikel deel ik 5 tips die helpen bij het trekken van conclusies uit een data-analyse. Helaas, er is geen ‘wondermiddel’ om statistieken en gegevensanalyse begrijpelijk en nuttig te maken voor onderzoek. Maar er zijn enkele dingen die je kunt doen om ervoor te zorgen dat alles soepel verloopt en waarmee je valkuilen kunt vermijden.

Veel marketeers proberen de kar voor het paard te zetten en ingewikkelde analyses uit te voeren voordat ze tijd besteden aan het onderzoeken van de gegevens vanuit een basisperspectief. Een data-analyse zal je niet altijd het antwoord geven op al je vragen. Kijk vooral naar de kansen die je wél kunt benutten uit het onderzoek om vervolgstappen te ondernemen.

1. Bekijk data met een open mindset

Het is goed om van tevoren te bedenken welke resultaten je uit een onderzoek verwacht. Bijvoorbeeld op basis van eerdere onderzoeken of bepaalde ‘onderbuikgevoelens’. Op deze manier kun je gerichter zoeken naar de data die relevant zijn voor je data-analyse.

Maar het is belangrijk om ervoor open te staan dat de data ook onverwachte resultaten kunnen opleveren. Zie dat niet als een verkeerde analyse. Als je ervoor open staat om nieuwe dingen te leren uit de data, zul je uit een data-analyse de beste conclusies trekken.

2. Maak duidelijk wat je kunt concluderen: correlatie of causaliteit?

Een vraag die statistici al jaren krijgen, maar dat maakt hem niet minder belangrijk: kun je uit een bepaalde analyse ook een causaal verband trekken of is er alleen sprake van een correlatie? Dit is een belangrijk verschil, omdat vanuit correlatie vaak te snel causaliteit wordt geconcludeerd. Maar wat betekenen deze twee termen eigenlijk?

In het kort zegt een correlatie hoe waarschijnlijk het is dat er een verband is tussen 2 variabelen. Een causaal verband daarentegen heeft daaruit een conclusie getrokken. Er is een oorzaak en een gevolg. Doordat het regent, nemen mensen hun paraplu mee. Soms zijn deze aannames logisch te verklaren. We hebben dan duidelijk in beeld wat de oorzaak en wat het gevolg is, zoals bij de regen en het gebruik van de paraplu. Helaas komt het vaak voor dat dit niet met zekerheid te zeggen is. Dan is het goed om jezelf af te vragen of correlatie tot causaliteit kan leiden of dat je alleen een correlatie mag vaststellen.

Het belangrijkste hierin is om goed na te denken of het een de ander kan voorafgaan en of er geen andere verklaring kan zijn voor het verband. Door te deduceren dat het logisch kan zijn dat er een causaal verband is, kom je al een heel eind richting de juiste conclusie.

Nicolas Cage en verdronken mensen in een zwembad

Hoewel de statistiek probeert om zoveel mogelijk toeval uit te sluiten, kan het voorkomen dat een significant effect toeval is. Het is dus erg belangrijk om logisch na te blijven denken. Uit onderzoeken blijkt bijvoorbeeld dat naarmate er meer Nicolas Cage-films zijn uitgekomen in een jaar, er meer mensen zijn verdronken in een zwembad. Verdrinken er meer mensen in een zwembad, omdat er meer Cage-films zijn uitgekomen? Of zouden er meer Cage-films zijn uitgekomen, omdat er meer mensen verdrinken in een zwembad? Of is het toch het meest waarschijnlijke antwoord op deze vraag: het is gewoonweg toeval?

Het uitsluiten van toeval is bijna niet te bereiken. Maar het helpt je al een heel eind op weg om, naast een statistisch verantwoord onderzoek te verkrijgen, goed te beredeneren waarom een verband zou kunnen bestaan.

3. Vorm één verhaal uit verschillende conclusies

Iedere data scientist of analist zou willen dat de data een objectief en compleet beeld van de werkelijkheid geven. Helaas is dit in de praktijk onhaalbaar. Er zal altijd een bepaalde mate van subjectiviteit van de onderzoeker in het onderzoek voorkomen. Zo kunnen 2 onderzoeken over dezelfde hypothese verschillende conclusies trekken.

Dat betekent niet dat een van de twee het direct ‘fout’ heeft. Vaak betekent dit (met de aanname dat beide onderzoeken legitiem zijn) dat beide onderzoeken een deel van de waarheid naar boven brengen. Dit verschil kan worden bepaald door het onderzoeken van verschillende soorten data, maar ook de aanpak van het onderzoek kan een rol spelen.

Beschrijvende analyses en correlatie-analyses kijken op een andere manier naar de data dan machinelearning-modellen. En ook die modellen onderling bekijken de data op verschillende manieren. Hieruit kunnen dus andere inzichten komen, maar het zijn de gezamenlijke conclusies uit deze verschillende onderzoeken die samen het beste resultaat vormgeven. Om uit meerdere onderzoeken de beste conclusies te halen, is het belangrijk om de onderzoeken naast elkaar te leggen en te bekijken hoe ze uiteindelijk samen één verhaal maken.

4. Heb geen cijferangst

In de wereld van nu worden we overspoeld met cijfers. Als je jezelf niet datavaardig vindt, kan dit zorgen voor onbegrip en zelfs cijferangst. Gelukkig is het interpreteren van cijfers te leren! Als data-analisten complexe technieken gebruiken om data te analyseren, verwacht dan niet dat alles makkelijk uitgelegd kan worden. Data-analyse heeft vaak moeilijke modellen nodig om een grote hoeveelheid aan data te analyseren. Zo’n black-boxmodel betekent niet dat een onderzoek niet betrouwbaar is, maar wel dat het heel moeilijk tot in de details uit te leggen is. De exacte werking van de modellen is niet de vraag die je moet willen beantwoorden. Maar probeer wel het doel van de modellen en de keuzes of aannames die hierbij gemaakt worden beter te begrijpen.

Dit helpt bij de interpretatie van de uitkomsten. Het kan hierbij ook helpen om jezelf te verdiepen in de wereld van cijfers en data-analyse. Als je zelf al een beter beeld hebt bij wat er wel of niet mogelijk is met data-analyse, zal het begrijpen en interpreteren van de cijfers ook beter gaan. Een leestip om hier meer gevoel bij te krijgen: het boek Data bedreven marketing (affiliate) van Danny Oosterveer (lees hier de boekrecensie op Frankwatching, red.).

Not everything that’s counted counts, and not everything that counts is counted.

5. Accepteer tekortkomingen

Als laatste tip, maar zeker niet de minste: accepteer tekortkomingen van data. Met data-analyse kun je vele hypotheses analyseren en interessante conclusies trekken, maar onthoud dat niet álles kan. Een data-analyse zal nooit het gehele verhaal vertellen. Het schetst een beeld van de werkelijkheid, maar het beeld zal nooit compleet zijn. Zo zorgen missende factoren of slecht gelogde kolommen er al snel voor dat je bepaalde aspecten mist bij het onderzoek.

Je moet ook rekening houden met een gedeelte aan missende factoren die niet verklaard kunnen worden vanuit de data. Als iemand bijvoorbeeld op het nieuws leest over mogelijke fraude van een bedrijf, kan dat invloed hebben op zijn tevredenheid. Maar dit zal niet terugkomen in je data. Het feit dat er factoren zijn die niet worden gedetecteerd in de data, is geen belemmering voor de uitkomsten van het onderzoek. Met behulp van data-analyse vind je namelijk het deel van de factoren die wel belangrijke impact hebben en daarnaast beïnvloedbaar zijn. Vanuit hier kun je nu de eerste stappen zetten om verbeteringen door te voeren, door acties te verbinden aan de conclusies van de data-analyse.

Bonus-tip: podcast over cijfers

Onze psychologie bepaalt de waarde van cijfers. Hoe zit het met ons, de cijferconsument? In hoofdstuk 6 van Het bestbeluisterde boek ooit (met deze titel) van journalistiek platform De Correspondent, duikt Sanne Blauw in de psychologie achter ons gebruik van cijfers. Al maken anderen fouten, we zijn zelf ook niet onschuldig. Beluister ook deze podcast.

Hopelijk helpen deze tips je op weg om ‘zwemvaardig’ te worden in data-analyses. Heb je nog vragen? Stel ze via de reacties hieronder.