Data analytics

Analytics: je verspilt marketingbudget door de verkeerde definitie van sessies

0

Sessies zijn de basis voor het toekennen en attributie geven van conversies aan verkeersbronnen en marketingkanalen. Een incorrecte definitie van sessies kan leiden tot een onjuiste toekenning en attributie. De meest gebruikte definities – zoals die in Google Analytics en Adobe Analytics – zijn relatief oud en lopen met de huidige technieken tegen flinke beperkingen aan. De vraag is: kunnen we deze definities nog gebruiken? Wat is de impact van deze definities en kunnen we deze ook verbeteren?

Om een beeld te krijgen van de impact van de definitie van sessies, beschrijf ik straks 2 scenario’s. Maar allereerst de twee meest gebruikte definities:

  • Definitie A (o.a. Adobe Analytics): Een sessie is een groepering van interacties binnen een bepaalde periode. Na 30 minuten inactiviteit eindigt de sessie.
  • Definitie B (o.a. Google Analytics): Een sessie is een groepering van interacties binnen een bepaalde periode. Na 30 minuten inactiviteit of als iemand via een nieuwe verkeersbron komt, eindigt de sessie.*

*Een aantal uitzonderingen vindt hierop plaats. Zoals direct verkeer en in sommige pakketten ook een lijst met verkeersbronnen die je zelf kunt definiëren.

De impact van sessies: twee scenario’s

Scenario 1

Stel je voor. Een gebruiker is op zoek naar een autoverzekering en googelt “Autoverzekering”. Het eerste resultaat is een betaalde zoekadvertentie van voorbeeldbedrijf.nl. De gebruiker klikt erop. Hij doet vervolgens een premieberekening op de website. Nadat de premie berekend is, is hij benieuwd naar de dekking. Hij opent een tabblad en zoekt “Dekking autoverzekering voorbeeldbedrijf.nl”. Het eerste resultaat is een organisch zoekresultaat. De gebruiker klikt op het resultaat en leest de informatie over de dekking. Vervolgens gaat de gebruiker terug naar het tabblad met de premieberekening en sluit daar vervolgens de autoverzekering af.

De komende twee schema’s laten de verschillende definities voor de sessies zien. Elke kleur representeert een sessie.

De sessie volgens definitie A.

De sessie volgens definitie A

In bovenstaand schema zie je één kleur. Dat betekent dat definitie A alle interacties toekent aan één sessie. Dit is een verschil met definitie B, zoals te zien is in het schema hieronder. Daar worden de laatste twee interacties toegekend aan een nieuwe sessie.

De sessie volgens definitie B.

De sessie volgens definitie B

Bij dit voorbeeld zou ik als volgt redeneren: de gebruiker wil een verzekering afsluiten en vestigt zijn aandacht op de website om deze af te sluiten. Zodra hij op de website komt, start zijn aandacht en daarmee zijn sessie. Het zoeken in Google kan vergeleken worden met het gebruik maken van de zoekfunctie van de website in kwestie. Hij heeft nog steeds aandacht voor het proces om de verzekering af te sluiten. Dit zou dus niet moeten resulteren in een nieuwe sessie.

In bovenstaand scenario is de definitie A correct. Definitie B kent de conversie toe aan het organische zoekresultaat, terwijl deze feitelijk niet anders functioneert dan een zoekfunctie op de website. Maar dat definitie A het in dit geval goed heeft, is meer geluk dan wijsheid. Dat zullen we zien in het volgende scenario.

Scenario 2

Een gebruiker heeft honger en twijfelt of hij gaat koken of gaat bestellen. Hij zoekt in Google op “Eten bestellen” en klikt op het eerste zoekresultaat, een zoekadvertentie. Nadat hij gekeken heeft wat hij wil eten, is hij van mening dat de bezorgkosten te duur zijn en verlaat de website. Vervolgens gaat hij naar een nieuwssite en krijgt daar binnen 30 minuten een advertentie te zien met als boodschap “Bestel nu met gratis verzending”. De gebruiker klikt erop en plaatst vervolgens de bestelling.

De komende twee schema’s laten de verschillende definities zien. Elke kleur representeert een sessie.

 

Interactieschema volgens definitie A.

Schema volgens definitie A.

In bovenstaand schema zie je één kleur. Dat betekent dat definitie A alle interacties toekent aan één sessie. Dit is een verschil met definitie B, zoals te zien is in het schema hieronder. Daar worden de laatste twee interacties toegekend aan een nieuwe sessie.

Interactieschema volgens definitie B.

Schema volgens definitie B.

Bij dit voorbeeld zou ik als volgt redeneren: de gebruiker is zich aan het oriënteren op de website. Zodra hij op de website komt, begint zijn aandacht voor dat proces en dus de sessie. Tijdens deze sessie kan hij besluiten om iets te bestellen, dan zit hij nog in hetzelfde moment van aandacht. Maar de gebruiker besluit te stoppen en gaat het nieuws lezen. Hiermee stopt zijn aandacht en dus zijn sessie. Vervolgens wordt hij op de nieuwssite verleidt om alsnog eten te bestellen. Dit zorgt voor een nieuw moment van aandacht voor de website en dus een nieuwe sessie.

In dit scenario zie je dat definitie A niet de juiste definitie heeft. In dit geval zorgt de banner er namelijk voor dat de gebruiker opnieuw terugkeert naar de website. Zonder deze banner was dit niet gebeurd. Dit moet resulteren in een nieuwe sessie. Definitie B heeft in dit scenario de voorkeur.

De tekortkomingen van beide definities

Beide definities hebben overduidelijk tekortkomingen. Deze tekortkomingen komen voort uit aannames die we doen om te bepalen of iemand daadwerkelijk zijn sessie stopt of niet. Technisch is het namelijk niet mogelijk om dit te meten. Als je geen rekening houdt met het feit dat je mensen kunt verleiden om opnieuw aandacht te geven via remarketing of andere kanalen (definitie A), dan onderwaardeer je je remarketingkanalen. Voornamelijk op het moment dat het van belang is om mensen op zeer korte termijn te verleiden (binnen 30 minuten), zoals bij het bestellen van eten.

Aan de andere kant zie je dat niet alle campagnes of kanalen zorgen voor een nieuwe sessie, omdat de aandacht niet gestopt is. Op het moment dat je tijdens het oriënteren Google gebruikt om iets op te zoeken, dan verlies je tijdens het zoeken niet de aandacht voor het afsluiten van je verzekering (definitie B) en zou je geen nieuwe sessie moeten starten. Hetzelfde geldt vaak voor bijvoorbeeld kortingscodes.

Het kiezen van één van deze definities heeft wel grote gevolgen voor de toekenning van waarde aan campagnes. Je kunt de technische beperkingen verminderen door zelf aanpassingen te doen aan je sessies. Later in dit artikel geef ik een suggestie voor een aanpassing van de definitie. Daarnaast kun je ook meer informatie opslaan en achteraf zelf sessies berekenen.

De gevolgen van een verkeerde definitie

Sessies zorgen voor de koppeling van interacties aan verkeersbronnen en marketingkanalen. Deze koppeling is de basis voor het verdelen van de waarde van deze interacties. De waarde wordt voornamelijk gecreëerd door speciale interacties die waarde opleveren voor het bedrijf: conversies.

De verdeling van waarde noemen we een attributiemodel. In het rekenvoorbeeld dat volgt, maken we gebruik van het “last-clickmodel”. Dat houdt in dat de waarde die in een sessie gecreëerd is, gekoppeld wordt aan de verkeersbron die de sessie gestart heeft.

Scenario 1: rekenvoorbeeld

Scenario 1 gaat over een website die verzekeringsproducten verkoopt. De website heeft een zoekwoordadvertentie draaien. Deze advertentie zorgt voor 5.000 gebruikers op de website. Dit heeft in totaal € 4.500,- gekost. Het conversiepercentage is 1% en de waarde van het afsluiten van een verzekering is € 150,-. De helft van de gebruikers volgt scenario 1 en maakt een uitstapje naar Google. De andere helft sluit direct een verzekering af.

Voor beide definities geldt dat de helft die direct de verzekering afsluit, gekoppeld wordt aan de zoekwoordadvertentie. Dat betekent een waarde van:

5.000 * 50% * 1% * € 150,- = € 3.750,-.

Voor de helft die wel het uitstapje maakt, is er een verschil tussen de definities. Bij definitie B wordt namelijk alle waarde gekoppeld aan het organische zoekresultaat en is er geen waarde voor de zoekwoordadvertentie.

Definitie A: 5.000 * 50% * 1% * € 150,- = € 3.750

Definitie B: € 0,-

Vervolgens kunnen we het rendement op advertentie-uitgaven berekenen (ROAS):

Definitie A: € 7.500 (€ 3.750 + € 3.750) – € 4.500 / € 4.500 * 100% = 66,7%

Definitie B: € 3.750 – € 4.500 / € 4.500,- = – 16,7%

In het ene scenario zou je ervoor kiezen om je advertenties door te laten gaan. Maar in het andere scenario lijkt alsof je op elke euro 16,7 cent verliest.

Scenario 2: rekenvoorbeeld

Het tweede scenario gaat over de website waar eten besteld kan worden. Daar stond een banner uit op een nieuwssite. Laten we zeggen dat we € 4.500,- geïnvesteerd hebben in de campagne om 50.000 gebruikers naar de website te krijgen. Van die gebruikers converteert 1% met een waarde van € 15,-. De ene helft van de gebruikers (25.000) volgden scenario 2 en hadden de banner gezien binnen 30 minuten nadat ze de website verlaten hadden. De andere helft was al langer dan 30 minuten niet meer op de website geweest.

Voor beide definities geldt dat voor de helft die al meer dan 30 minuten de website verlaten had, de volledige waarde toegekend wordt aan de bannercampagne.

50.000 * 50% * 1% * € 15,- = € 3.750,-

Voor de helft die binnen 30 minuten op de banner klikte, geldt wel een verschil tussen definitie A en B. Definitie A ziet namelijk de banner niet als een nieuwe sessie en koppelt daarom geen waarde aan de bannercampagne.

Definitie A: € 0,-

Definitie B: 50.000 * 50% * 1% * € 15,- = € 3.750,-

Vervolgens kunnen we het rendement op advertentie-uitgaven berekenen (ROAS):

Definitie A: € 3.750 – € 4.500 / € 4.500,- = -16,7%

Definitie B: € 7.500 (€ 3.750 + € 3.750) – € 4.500 / € 4.500 * 100% = 66,7%

Ook in dit scenario zie je een groot verschil tussen beide definities.

Alternatieve definitie voor een sessie

Dit is een alternatieve definitie voor een sessie: “Een sessie is een bundeling van interacties die een gebruiker doet tijdens een periode van aandacht.”

Een voorbeeld maakt deze definitie wellicht duidelijker. Op het moment dat ik een serie wil kijken op Netflix, dan begint mijn aandacht voor het doel “mezelf vermaken met series kijken”, zodra de website geladen is. Alle interacties die ik doe om dat doel te bereiken (inloggen, serie opzoeken en starten, volgende aflevering bekijken, overslaan van de intro) horen bij die poging en dus bij die sessie. Zodra ik klaar ben met kijken en de website verlaat, dan is mijn aandacht weg en stopt mijn sessie. Als ik de volgende dag opnieuw naar Netflix ga, dan heb ik opnieuw een moment van aandacht. Deze stopt weer als ik klaar ben met kijken of als bijvoorbeeld de website niet goed functioneert.

Suggestie verbetering: uitgebreide verwijzingsuitsluitingen

Definitie B wordt door Google Analytics gehanteerd. Ze hebben een goede toevoeging gedaan: de mogelijkheid bieden om bepaalde websites uit te sluiten van het starten van een nieuw bezoek. Dit noemen ze “verwijzingsuitsluitingen”.

Een voornaamste reden van verwijzingsuitsluitingen is het uitsluiten van verkeer van eigen websites die naar elkaar linken en het uitsluiten van verkeer via een betaalprovider. Deze uitsluitingen zorgen er voor dat er geen onterechte conversies toegekend worden. Het probleem dat ik heb geschetst in scenario 1 met definitie B zou niet van toepassing zijn als we Google uitsluiten van het starten van een nieuwe sessie.

Helaas zijn deze uitsluitingen beperkt tot de url van een website. Een goede verbetering zou zijn als je niet alleen url’s kunt uitsluiten, maar ook andere variabelen kunt gebruiken, zoals het medium.

Definitie C voor een sessie

Mijn verder uitgebreide definitie: “Een sessie is een groepering van interacties binnen een bepaalde periode. Na 30 minuten inactiviteit of als iemand via een nieuwe verkeersbron komt eindigt de sessie, tenzij deze verkeersbron of het medium uitgesloten is van het eindigen van een sessie.”

Deze definitie is gebaseerd op de volgende aannames:

  1. Op het moment dat iemand 30 minuten inactief is, dan is de gebruiker niet meer bezig met het beoogde doel.
  2. Op het moment dat iemand via een nieuwe verkeersbron komt, dan komt hij van een andere website en is in de basis de aanname dat de aandacht verloren gegaan is. (scenario B).
  3. Bij sommige verkeersbronnen kan op punt 2 een uitzondering gemaakt worden. Hierbij doen we de aanname dat ze ondersteunen tijdens het proces en dat de aandacht niet verloren is gegaan. (scenario A).

Search en affiliates uitsluiten

De verkeersbronnen die met search en de meeste affiliates te maken hebben, sluiten we normaal gesproken uit van het starten van een nieuwe sessie. We gaan ervan uit dat het verkeer uit die bronnen niet het gevolg is iemand die zijn aandacht verloren heeft. Je mag aannemen dat de gebruiker deze verkeersbronnen gebruikt als aanvulling op het proces waar de hij mee bezig was. Hieronder wordt dit verduidelijkt aan de hand van drie voorbeelden.

  • In scenario A gebruikte de gebruiker de zoekfunctie om meer informatie te krijgen tijdens het behalen van zijn doel. Dit is niet wezenlijk anders dan het gebruik maken van de zoekfunctie van de website of het lezen van artikelen op de website. Het uitstapje naar Google zou dan ook geen nieuwe sessie moeten starten. Als toevoeging zou je daarnaast de zoekopdrachten vanuit Google kunnen registreren. Ook al heb je geen nieuwe sessie, toch kun je dan zien welke zoekopdrachten via Google gedaan zijn en deze rapporteren naast de zoekopdrachten op je eigen website.
  • Op het moment dat je eten bestelt en een kortingscode zoekt, dan is wederom je doel niet veranderd en zou er geen nieuwe sessie moeten starten. Je plan is nog steeds om eten te bestellen, alleen kijk je of het iets goedkoper kan.
  • Bij display advertising doe je wel de aanname dat er een nieuw doel ontstaat. De gebruiker is namelijk gestopt tijdens zijn eerste poging. Je probeert de gebruiker te verleiden om een nieuwe poging te doen. Display advertising wil je daarom niet uitsluiten van het starten van een nieuw bezoek.

Sla meer informatie op over landingen en bereken zelf sessies

Deze suggestie is iets complexer en zal ik aan de hand van een voorbeeld toelichten. In onderstaand voorbeeld gaat een gebruiker een product kopen. Hij doorloopt de website, gaat vervolgens naar de betaalpagina op een andere website en komt dan terug op de bedankpagina. We hanteren definitie B, die Google Analytics ook hanteert.

De sessie volgens definitie B.

De sessie volgens definitie B.

In dit geval wordt op de bedankpagina een nieuw bezoek gestart, omdat we via een nieuwe verkeersbron (de iDEAL-pagina van Knab) komen. Dat betekent dat alle bestellingen toegewezen worden aan de payment service providers. We kunnen in onze rapporten geen koppeling maken met de daadwerkelijke verkeersbron.

Verwijzingsuitsluitingen

Dit is ongewenst. Daarom kun je gelukkig in Google Analytics verwijzingsuitsluitingen instellen. Dit houdt in dat, ook als de bezoeker via een nieuwe verkeersbron komt, geen nieuwe sessie gestart wordt. In onderstaand voorbeeld sluiten we knab.nl uit.

De sessie, nu met knab.nl uitgesloten.

De sessie, nu met knab.nl uitgesloten.

Na onze aanpassing zie je dat de laatste pageview netjes binnen dezelfde sessie blijft. Helaas gaat er wel informatie verloren. De utm-parameters worden namelijk niet verwerkt en in onze rapporten zullen we niet zien dat er ook een landing plaatsvond via medium: payment en source: knab.

Informatie over de verwijzer opslaan

Dit is zonde, omdat het interessante informatie is die je niet verloren wil laten gaan. Je kunt dit oplossen door bij een landing altijd alle informatie over de verwijzer op te slaan. Deze informatie staat dan los van de informatie van de sessie.

De sessie met alle informatie over de verwijzer.

De sessie met alle informatie over de verwijzer

We slaan met elke interactie (die uit een externe website volgt) op welke metadata bekend is. Stel dat we later bedenken dat een verwijzing vanuit medium: payment wel zou moeten leiden tot een nieuwe sessie? Dan kun je dat met deze informatie berekenen. Dit zorgt ervoor dat je bij een verkeerde instelling niet direct al je historische data kwijt bent.

Bovenstaande toepassing is geavanceerd en vergt een Analytics-pakket dat je toegang geeft tot ruwe data en bovendien in staat is om complexe berekeningen te doen. Het kost vaak een (beperkte) investering aan tijd en geld, maar het is het dubbel en dwars waard.

Sessies zijn het fundament voor attributiemodellen

Sessies zorgen voor een koppeling tussen interacties op de website en de verkeersbronnen die geleid hebben tot die interacties. Daarmee zijn ze het fundament voor de toepassing van attributiemodellen en het correct waarderen van je online campagnes. De keuze van de definitie van sessie heeft daarom ook grote gevolgen voor deze waardering. Het is essentieel om goed te begrijpen welke definitie de basis vormt voor jouw data.

Het is essentieel om goed te begrijpen welke definitie de basis vormt voor jouw data.

Technische beperkingen om te detecteren of een sessie geëindigd is, zorgen er helaas voor dat je aannames moet doen over wanneer een sessie start en eindigt. Webanalytics-pakketten hebben deze aannames verwerkt in hun definities. Je kunt bijvoorbeeld niet weten of iemand de website verlaat. Je doet de aanname op het moment dat iemand 30 minuten inactief is. Ga na of je wellicht met kleine aanpassingen deze definities kunt verbeteren.

Daarnaast kun je ook het heft in eigen handen nemen en ervoor zorgen dat je alle benodigde data gaat verzamelen om zelf te bepalen wat een sessie is. Dit is complex. Maar het geeft je wel volledige controle over je data en waarborgt de kwaliteit van de waardering van je online marketinginspanningen.