Data analytics

Waarom je data in Google Analytics niet kloppen

0

Rond de 30 à 50 miljoen websites gebruiken Google Analytics. Veel website-eigenaren verzamelen niet alleen data met de tool, maar gebruiken het ook bij het maken van belangrijke keuzes. Wat veel mensen niet weten, is dat er soms onjuiste informatie in Google Analytics te zien is. Zorg er dus voor dat je met ‘schone’ data te maken hebt als je deze tool ook bij bedrijfskeuzes gebruikt.

Maak verschillende weergaves

Zodra je gaat beginnen met Google Analytics, is het belangrijk om verschillende dataweergaven te maken. Kies bijvoorbeeld voor een master-, raw- en een test-versie.
De raw data view is een view zonder filtering of andere uitsluitingen. Het advies is om deze view alleen te gebruiken om te vergelijken met de master view. Het is een back-up zodra je master view te veel vervuild is. Zodra je de eerste filters gaat toepassen is het handig om deze eerst te testen op de test view voordat je het doorzet naar de master view. De master view gebruik je als dashboard.

Verschillende dataweergave in Google Analytics.

Hierdoor kun je altijd terug naar een schone database op het moment dat er iets fout gaat. Dit kun je instellen via het beheerdersportaal.

Veel bedrijven hebben maar één view waarin alle data binnenkomt waarbij er ook nog niet gedacht wordt aan al het interne verkeer. Zorg er dus direct voor dat je op de master view IP-uitsluitingen toevoegt. Denk dan niet alleen aan de IP-adressen van kantoor, maar ook aan IP-adressen van eventuele derde partijen en aan thuisadressen als medewerkers ook thuis werken. Anders neem je namelijk het ‘interne’ verkeer mee in de statistieken.

Dit kun je aanpassen via: beheerders > filters
IP-adressen filteren in Google Analytics.

Let wel op dat je filters wel eerst test in de test View. Dit voorkomt namelijk dat je belangrijke data niet ziet doordat dit door een filter wordt tegengehouden.

Als laatste is het belangrijk de juiste verwijzingen toe te voegen. Veel Analytics-accounts hebben een zeer hoog referral-cijfer. Maar als je verder kijkt, zie je vaak dat dit vooral doorverwijzingen zijn vanuit de betalingsoptie zoals betalen.rabobank.nl.

Dit kun je aanpassen via beheerders > Tracking Info > Lijst met verwijzingsuitsluitingen
Zet hierin de domeinnamen die je ziet in het referral-lijstje.

Cookies

Sinds de invoering van de GDPR (AVG) is het niet vanzelfsprekend dat je een Analytics-cookie mag plaatsen, waardoor je veel data kan missen. Zodra een bezoeker aangeeft geen cookie te willen ontbreekt de data van deze bezoeker ook in Google Analytics. Na het bekijken van diverse webshops is duidelijk te merken dat dit gedeelte van de GDPR het meest onduidelijk is.

Sommige websites en webshops hebben vrij strenge cookievoorwaarden, terwijl andere shops dit niet hebben. Zo vind je op de shop van Coolblue de volgende cookie:

‘Om je beter en persoonlijker te helpen gebruiken wij cookies en vergelijkbare technieken. Met de cookies volgen wij en derde partijen jouw internetgedrag binnen onze site. Hiermee tonen we advertenties op basis van jouw interesses en kun je informatie delen via social media. Als je verdergaat op onze website gaan we ervan uit dat je dat goedvindt. Meer weten? Bekijk onze cookiepagina.’

Cookiemelding van Coolblue.

Waarbij je bij het eerste bezoek het volgende script kunt vinden:
Script cookies Coolblue.

Bij het bekijken van een tweede pagina of het opnieuw bezoeken van de homepagina zie je het volgende script. De cookie accepted by user staat op ‘1’ en de cookie preferences op ‘all’.Script cookiess Coolblue tweede bezoek of pagina.

Als bezoeker ga je dus akkoord met het plaatsen van een volledige cookie zodra je de webshop verder gebruikt. Bij andere websites zie je dat ondanks je er eerst op ‘akkoord’ moet klikken de volledige cookie al ingesteld is.

Cookie restriction mode

Ook zie je cookies waarbij er echt op akkoord geklikt moet worden voordat er een cookie geplaatst wordt. Zo zie je in onderstaand scriptje dat er geen cookie restriction mode aanwezig is. Alle data komt zonder een ‘akkoord’ nodig te hebben binnen.

Script zonder cookie restriction mode.

Het is belangrijk om te weten welke cookie er geplaatst wordt. Je kunt dan de data in Analytics beter op waarde schatten en eventueel cookie oorkeuren aanpassen. Het zou toch zonde zijn als er belangrijke gegevens missen.

Naast dat de bezoeker de keuze heeft om cookies te plaatsen, kunnen er ook nog andere zaken spelen, zoals:

  • De gebruiker verwijdert de cookies handmatig.
  • De betreffende browser accepteert de cookies niet.
  • De firewall van de gebruiker verwijdert of blokkeert de cookies.

Sessieduur en landingspagina’s

Een merchant vroeg laatst hoe het komt dat sommige pagina’s een zeer lange sessieduur hebben. En hoe het komt dat sommige bezoekers landen op pagina’s zoals www.webshop.nl/winkelwagen. Informatie waarbij je al snel het gevoel krijgt dat er iets niet klopt of dat je iets moet aanpassen.

Dit alles heeft te maken met de duur van een sessie. Stel, een bezoeker bezoekt een webshop en bekijkt bijvoorbeeld een categoriepagina. Nadat ze iets aan de winkelwagen heeft toegevoegd, wordt ze even afgeleid en legt haar telefoon weg. 30 minuten nadat ze is begonnen met het bezoeken van de shop, wordt haar sessie afgesloten en wordt er een nieuwe sessie opgestart zodra de pagina weer actief wordt.

Zodra ze haar telefoon weer pakt en de webpagina opent, begint een nieuwe sessie met een nieuwe landingspagina, namelijk: /winkelwagen.

Dit betekent dat ze misschien in Google Analytics wel 20 minuten actief is geweest op de winkelwagenpagina in de tijd dat ze haar telefoon heeft weggelegd. Maar je kunt hieruit niet concluderen dat de winkelwagenpagina niet klopt. Dit is niet alleen het geval bij het even wegleggen van de telefoon, maar ook bij het gebruik van meerdere tabs.

Gemiddelde sessieduur klopt niet

Ook kun je er niet van uitgaan dat de (gemiddelde) sessieduur klopt. Soms wordt de sessieduur niet goed gemeten door Analytics, waardoor er een 0 seconde-meting wordt gedaan. Dit is voornamelijk het geval bij een bounce of een exit van een pagina. Google meet namelijk de sessieduur van het begin van het bezoek aan de pagina totdat de bezoeker naar de volgende pagina gaat. Bij het verlaten van de site wordt er van de laatste pagina geen meting doorgegeven. Bij bounces is er sowieso geen meting (bezoeker heeft immers maar een pagina bezocht). Ook deze metingen worden meegenomen in het gemiddelde, waardoor de metric geen reëel beeld geeft.

Bij pagina’s met een hoge bouncerate lijkt het dat er geen engagement is op de specifieke pagina’s, terwijl de bezoeker wel heeft gevonden wat ze zocht en misschien wel de complete content heeft bekeken.

Er zijn diverse API’s beschikbaar om bijvoorbeeld de tab switch (Page Visibility API) en de sessieduur bij exitpagina’s (Beacon API) beter bij te kunnen houden.

Desondanks moet je voorzichtig zijn om de sessieduur en landingspagina’s 1-op-1 te gebruiken om beslissingen te kunnen nemen. Extra data zoals van Hotjar of andere data tools is hierbij zeker aan te raden.

Snelheid

De snelheid van een site is zeer belangrijk in de gebruikerservaring van de bezoeker maar ook voor SEO. Vanzelfsprekend is dit een metric die vaak terugkomt in groeiplannen.

Websites met een laag aantal bezoekers hebben soms te maken met een sitesnelheid van 0 seconde. Op dat moment denk je waarschijnlijk dat je een snelle site hebt, maar niets is minder waar.

Google Analytics meet maar 1%

Google Analytics meet namelijk default maar 1 procent van de bezoekers. Op het moment dat er te weinig bezoekers zijn kan de snelheid simpelweg niet gemeten worden. Maar ook voor sites met veel bezoekers is een meting van 1 procent niet wat je misschien zou verwachten.

Een fix is gelukkig simpel. Wil je meer bezoek laten meten voor een accuratere snelheid? Vraag je developer om onderstaande snippet toe te voegen. Deze snippet zorgt er namelijk voor dat niet 1 procent van de bezoekers wordt gemeten maar 10 procent. Je kunt nog verder optimaliseren via Google Tag Manager. Het artikel ‘Meet de invloed van je sitesnelheid op je conversieratio’ laat exact zien hoe je dat moet aanpakken.

Snippet om te zorgen dat Google Analytics 10% van je bezoekers meet om de snelheid van je site te bepalen.

Daarnaast moet je je sowieso afvragen of dit wel de beste metric is om te gebruiken als KPI. Je kunt er bijvoorbeeld beter voor kiezen om bij deze metric alleen het verloop van de snelheid in de gaten te houden. Kritieke periodes zijn bijvoorbeeld na een live release of andere aanpassingen.

Dubbele scripts

Veel websites beginnen met een ‘gewoon’ Google Analytics-account. Deze wordt dan met een eenvoudig GA-script in de code gezet. Zodra een marketingpartij wordt toegevoegd, stappen veel websites over op Google Tag Manager. Marketingbureaus willen namelijk zo veel mogelijk (en soms de onzinnigste) data verzamelen.

Google Analytics wordt dan ook toegevoegd aan Google Tag Manager. Daardoor krijg je een dubbel Google Analytics-script op je site. Als je meerdere scripts hebt lopen, betekent dit ook dat er meerdere pageviews worden doorgegeven. Dit zorgt ervoor dat je bounce rate niet klopt. Een bounce is namelijk het geval als er maar één pageview wordt doorgegeven. De bezoeker bezoekt immers maar één pagina. Op het moment dat er twee scripts lopen worden er twee pageviews doorgegeven. Dit zal een bounce geven van 0.

Dubbele scripts zorgen voor incorrecte data! Kijk dus goed of na Google Tag Manager geen dubbele scripts te vinden zijn. Dit geldt vanzelfsprekend voor alle scripts van derde partijen. Dit kan bijvoorbeeld met de Tag Assistant Chrome extension.

Verkeerd ingestelde triggers

We blijven bij Google Tag Manager. Het is natuurlijk een ideale tool om verschillende elementen op je site te meten. Maar een verkeerde instelling kan er zo voor zorgen dat je werkt met verkeerde data en dus je beslissingen baseert op verkeerde aannames.

Zo kun je bijvoorbeeld een bepaalde call-to-actionknop meten. Door juiste instellingen komt er data binnen waar je veel aan hebt. Ondertussen is een developer bezig met aanpassingen aan de shop. Hierdoor verdwijnt de knop of wordt de knop verplaatst, zonder dat je hier van af weet. De data stokt of er komt data binnen van een heel andere bron.

Bekijk dus zeer zorgvuldig alle trigger-elementen. Vooral na eventuele live releases en designaanpassingen.

Botverkeer

Wow! Je bezoek is lekker aan het stijgen en je krijgt een hoop data binnen. Je duikt verder de data in. Wat blijkt: er komt een hoop botverkeer binnen! Dit bot verkeer kan tussen de 20 tot 50 procent van het totale verkeer zijn.

Het botverkeer zorgt niet alleen voor onjuiste data in Google Analytics, maar kan ook zorgen voor ddos-aanvallen, site scraping, SEO-spam of gewoon fraude.
Gelukkig zorgt Google ervoor dat een hoop botverkeer al geblokkeerd wordt. Desondanks is het handig om dit zelf ook in de gaten te houden.

Dit kun je als volgt checken:
Botverkeer checken in Google Analytics.

Ga naar Aquisitie > Alle verkeer > Kanalen. Kies als primaire dimensie voor ‘Hostnaam’. Je ziet nu het eventuele botverkeer. Om je data op te schonen is het handig om deze bots via filtering uit te sluiten.

Het nut van correcte data

Er gaat geen congres, presentatie of blog voorbij waar het nut van data niet wordt aangestipt. Let wel: dit gaat dan over correcte data. Beslissingen maken op basis van onjuiste data is ongeveer hetzelfde als beslissingen maken op basis van onderbuikgevoel. Het is nergens op gebaseerd. Neem dus nooit gegevens vanuit een datatool direct als waar aan, maar onderzoek het verder. Zeker als er belangrijke beslissingen op gebaseerd moeten worden.