Onderzoek, Strategie

Google’s Hummingbird 1 jaar later: heb jij je SEO-strategie al aangepast?

Het algoritme dat Google in 2013 introduceerde heet Hummingbird, omdat de zoekgigant beloofde dat het algoritme precies en snel is. Wat is de impact hiervan, een jaar later? Wat weten we eigenlijk van Google Hummingbird? En wat zien we ervan in de zoekresultaten? Een analyse van de belofte van Google en wat we ervan terug zien.

Hoe heeft het web zich ontwikkeld?

Om te begrijpen wat het Hummingbird-algoritme inhoudt, is het belangrijk om te begrijpen hoe het web zich ontwikkelt. Op moment bevindt het internet zich in de fase web 3.0. Twee pijlers vormen een belangrijke rol bij de ontwikkeling van het web.

  1. Socialisatie
  2. Semantiek

1. Socialisatie

Het aantal connecties en relaties tussen mensen groeit continu. Met name door de opkomst van veel sociale netwerken tijdens web 2.0, is deze ontwikkeling snel van start gegaan.

2. Semantiek

Semantiek is de groei van connecties of relaties tussen data of zelfs informatie. Bij het semantisch kunnen webmachines en -systemen zonder tussenkomst van mensen data begrijpen en relaties leggen. Dit thema staat centraal bij web 3.0. Google’s doel met het compleet vernieuwde algoritme is juist om data te begrijpen en relaties te leggen.

Afbeelding 1: ontwikkeling van het web

Ontwikkeling van het web.

Menselijke taal versus computertaal

Programmeertalen, maar bijvoorbeeld ook html, zijn exact gedefinieerde, formele talen die een computer begrijpen kan. Een browser is in staat om html (syntax) om te zetten in een leesbare pagina, maar heeft geen idee wat de betekenis (semantiek) is van de inhoud binnen die pagina.

Zoekmachines begrepen betekenis niet

Voor zoekmachines was dit in de beginfase van het web niet anders, hoewel zoekmachines dankzij de HTML-syntax (paginatitel, headings en links tussen documenten) beter werden in het selecteren en presenteren van relevante documenten in de zoekresultaten.

Maar voor zoekmachines bleef onduidelijk wat er met de inhoud van het document bedoeld werd. De nadruk lag lang op de beschikbaarheid van trefwoorden (keywords). Zoekmachine-optimalisatie (SEO) was tot voor kort dan ook altijd gefocust rondom zoektermen.

hummingbird 2 - het web van documenten

Het web zoals het begon: een door hyperlinks gekoppelde verzameling van documenten.

Betekenis en entiteiten

Inhoudelijk gaan (web)documenten natuurlijk over allerlei onderwerpen, zoals producten, mensen, boeken, evenementen, bedrijven en accomodaties. Een beschrijving van kenmerken maakt duidelijk welke kleur schoenen het zijn of welke ingrediënten een recept bevat.

We hebben het dan over entiteiten en de kenmerken, ofwel properties, waarover ze beschikken. Het semantisch web is er op gericht om computers en dus ook zoekmachines te laten begrijpen wat de betekenis is van entiteiten binnen (web)documenten, door relaties tussen entiteit en kenmerken te beschrijven.

Het semantisch web ontwikkelt zich daarmee van een web van documenten naar een web van entiteiten. En ook Hummingbird leunt daar zwaar op.

hummingbird 3 - het web van entiteiten

Het web van nu: entiteiten met hun eigenschappen.

Betekenis beschrijven: triples

We gaan dus van keywords naar entiteiten, of van ’strings’ to ’things’. Van woorden die gebruikt worden om dingen te beschrijven naar het ding dat beschreven wordt. Het semantisch web beschikt over een standaard om ‘dingen’ of objecten te beschrijven. We noemen dat ‘triples‘: een structuur van subject, predicaat en object.

  1. Het subject is de entiteit die beschreven wordt.
  2. Het predicaat is het kenmerk of aspect van de entiteit die beschreven wordt.
  3. Het object tenslotte, is wat de waarde van dat kenmerk is.
hummingbird 4 - triples

‘Triples’ gevisualiseerd met drie voorbeelden.

In het semantische web wordt alle informatie dus gestructureerd volgens een gestandaardiseerde taal. Je kunt het ook ‘structured data’ noemen.

Schema.org

De zoekmachines Google, Yahoo, Bing (en later) Yandex) hebben in 2011 de standaard Schema.org gelanceerd: een standaardtaal om data te structureren. En ook nu is het geen toeval dat Schema.org gebruik maakt van triples. Maar zelfs zonder Schema.org kan Google steeds vaker de betekenis van een zoekvraag begrijpen en antwoord geven. Een voorbeeld uit de Verenigde Staten:

hummingbird 5 - google antwoord

Voorbeeld van een antwoord zonder expliciete structured data (zoals Schema.org).

Zo werkt het: als we de benaming van triples volgen, dan is in dit voorbeeld ‘Title’ het subject, ‘Length’ het predicate en ’50-60 characters’ het object.

Waarom is dit allemaal belangrijk?

Helder, al die theorie. Maar waarom zijn het semantische web, triples en entiteiten belangrijk? En wat heeft dat te maken met Hummingbird? Het antwoord zit in de ambitie van Google:

Larry Page, onze medeoprichter en CEO, beschreef de ‘perfecte zoekmachine’ ooit als iets ‘dat precies begrijpt wat je bedoelt en je precies vertelt wat je wilt weten’

Google wil je antwoorden geven op je (zoek)vragen. En niet een lijstje met documenten waar je antwoord misschien op te vinden is.

Van zoekmachine naar ‘antwoordmachine’

Google wil zich dus van een zoekmachine naar een ‘antwoordmachine’ ontwikkelen. De afgelopen twee jaar zijn daar al een paar producten en diensten voor gelanceerd, namelijk:

Om zulke producten en diensten te kunnen leveren is het noodzakelijk dat Google de betekenis van (web)documenten en informatie begrijpt. In juni 2012 zaten er in Google Knowledge Graph al 500 miljoen entiteiten en meer dan 3,5 miljard relaties tussen deze entiteiten. Sindsdien zijn deze aantallen vast alleen maar verder gegroeid. De Knowledge Graph, bijvoorbeeld, zou je misschien beter de ‘Entity Graph’ kunnen noemen. En bij het (semantisch) zoeken van nu past misschien wel beter de naam ‘Entity Search’.

Het antwoord: Hummingbird

Google is dus al langer bezig met structured data, maar om echt te ontwikkelen naar de ‘antwoordmachine’, was een nieuw algoritme nodig. Hummingbird draait volledig op het begrijpen van informatie en het geven van antwoorden. Wist je dat 15 procent van alle zoekopdrachten bij Google nooit eerder ingegeven zijn in de zoekmachine? Hoe geef je dan toch een goed antwoord? Om op die onbekende zoekopdrachten een relevant antwoord te kunnen geven, is het noodzakelijk om de betekenis van die onbekende zoekopdrachten te kunnen bepalen.

Het algoritme van Google is één van de drie hoofdonderdelen van de zoekmachine. Een zoekmachine bestaat namelijk uit een crawler, index en algoritme. De crawler verzamelt de informatie, wat in de index opgeslagen wordt. Het algoritme bepaalt vervolgens de rangschikking van de zoekresultaten. Het algoritme is dus de kern van een zoekmachine en mag gezien worden als het belangrijkste onderdeel. Lees daarvoor ook de ‘Handleiding: hoe werkt een zoekmachine?‘.

De facts: wat Google zegt

We weten nu waarom Hummingbird geïntroduceerd is en wat het algoritme zou moeten doen. Maar wat weten we er eigenlijk echt van? Google heeft er weinig over naar buiten gebracht, maar dit is wat we tot nu toe weten:

1. Hummingbird is live sinds augustus 2013

Het nieuwe algoritme kondigde Google in september 2013 aan tijdens haar vijftiende verjaardag. Daar gaf Google aan dat het nieuwe algoritme al een maand geleden, dus in augustus 2013, in gebruik was genomen, zoals een persverslag aangeeft:

Google started using Hummingbird about a month ago, it said. Google only announced the change today.

2. Volledig nieuw algoritme

Hummingbird is een compleet nieuw algoritme, geen uitbreiding of aanpassing van bestaande algoritmes. Vanuit het hierboven aangehaalde persverslag:

When Google switched to Hummingbird, it’s as if it dropped the old engine out of a car and put in a new one. Hummingbird is a brand new engine.

Er worden meer dan 500 verschillende (sub)algoritmes gebruikt. Kortom, binnen het totale (Hummingbird) algoritme bestaan er meer dan 500 signalen en algoritmes.

3. Google begrijpt betekenis

Google beloofde dat Hummingbird de betekenis achter zoekopdrachten beter begrijpt: pagina’s die beter aansluiten op de betekenis van zoektermen scoren beter (dan pagina’s die alleen met de woorden uit een zoekopdracht matchen). Dat geeft ook de hoogste baas van het zoekalgoritme, Amit Singhal, aan tijdens de aankondiging van Hummingbird:

We now get that the words in the search box are real world people, places and things, and not just strings to be managed on a web page.

Google heeft eerder al aangegeven dat het in staat is om automatisch de betekenis van woorden te achterhalen. Bijvoorbeeld in een blogartikel uit (toevallig?) augustus 2013:

Word2vec uses distributed representations of text to capture similarities among concepts. It understands that Paris and France are related the same way Berlin and Germany are (capital and country), and not the same way Madrid and Italy are. […] it can learn the concept of capital cities, just by reading lots of news articles — with no human supervision.

Google kreeg al in 2011 een patent dat beschrijft hoe de zoekmachine betekenis kan toekennen aan zoekopdrachten:

A search query for a search engine may be improved by incorporating alternate terms into the search query that are semantically similar to terms of the search query, taking into account information derived from the search query. An initial set of alternate terms that may be semantically similar to the original terms in the search query is generated.

In de eerder genoemde ‘antwoordproducten’, Knowledge Graph en Voice Search, is te zien dat Google de belofte waarmaakt.

4. Zelfde & nieuwe ranking-factoren

Ondanks dat Hummingbird een compleet nieuw algoritme is, gebruikt Google nog dezelfde ranking factoren. Maar het geeft tegelijkertijd aan dat er ook nieuwe factoren gebruikt (gaan) worden:

In general, Hummingbird  is a new engine built on both existing and new parts, organized in a way to especially serve the search demands of today, rather than one created for the needs of ten years ago, with the technologies back then. Hummingbird is a brand new engine, though it continues to use some of the same parts of the old, like Penguin and Panda.

Praktijk: wat merken we ervan?

Uiteindelijk zijn we als marketeers natuurlijk geïnteresseerd in wat we er in de praktijk van merken en hoe we ermee om moeten gaan. Opvallend genoeg heeft eigenlijk niemand opgemerkt dat het volledig nieuwe algoritme in gebruik werd genomen in augustus vorig jaar. Er waren wel wat speculaties, maar niemand heeft grote verschuivingen in de zoekresultaten waargenomen. Dat is op zich al een knappe prestatie van Google.

Als de belofte klopt…

Google doet met Hummingbird de belofte dat het nu ook begrijpt welke intentie achter zoektermen schuilt. In de praktijk betekent dit dat er minder verschillende pagina’s en sites in de zoekresultaten zouden moeten voorkomen. Dat zal ik even uitleggen.

Als Google de intentie achter zoektermen begrijpt, dan snapt Google dus ook dat er veel verschillende zoekopdrachten zijn die eigenlijk dezelfde intentie hebben. En dat houdt in dat dezelfde webpagina’s dus het antwoord kunnen vormen op veel verschillende zoektermen. Het ‘oude’ SEO, voordat Hummingbird geïntroduceerd werd, ging eigenlijk over het zo goed mogelijk laten matchen van webpagina’s en zoektermen:

hummingbird 6 - oude seo

Voorbeeld van het ‘oude’ SEO.

Je ziet duidelijk dat verschillende webpagina’s zijn geoptimaliseerd voor verschillende zoektermen (laminaat leggen, laminaatvloer (zelf) leggen, laminaat zelf leggen). Maar is de intentie achter deze zoekopdrachten niet eigenlijk hetzelfde? Ja, natuurlijk. En bovenstaande zoekresultaten zul je dus tegenwoordig steeds minder tegenkomen.

Domeindiversiteit neemt af

Als het aantal webpagina’s, of eigenlijk het aantal verschillende sites, minder wordt, dan neemt de zogeheten ‘domeindiversiteit’ af. Oftewel, het aantal verschillende domeinen dat in de zoekresultaten verschijnt, zou na de introductie van Hummingbird dus moeten afnemen.

En diverse onderzoeken laten precies deze beweging zien. Kijk bijvoorbeeld maar eens naar onderstaande voorbeelden. Dit zijn de zoekresultaten voordat Hummingbird geïntroduceerd werd:

hummingbird 8 - pre-hummingbird

Pre-Hummingbird: zoekresultaten voor vergelijkbare zoekopdrachten verschillen sterk.

En dit zijn dezelfde zoekresultaten nadat Google Hummingbird live is:

hummingbird 7 - post-hummingbird

Post-Hummingbird: zoekresultaten vaak hetzelfde voor vergelijkbare zoekopdrachten.

Zoals je kunt zien, geven de twee verschillende zoekopdrachten ‘rice dish’ en ‘rice recipe’ duidelijk andere zoekresultaten voor en na Hummingbird. Na de introductie Hummingbird zijn er duidelijk meer dezelfde zoekresultaten. Het aantal verschillende domeinen in de zoekresultaten neemt dus af.

Voorbeelden uit Nederland

Ook als ik kijk naar diverse opdrachtgevers, dan zie ik dat het aantal verschillende pagina’s dat bezoekers krijgt uit organische zoekresultaten na de introductie van Hummiongbird is afgenomen.

Voorbeeld 1: financieel dienstverlener

In de maanden voorafgaand aan de introductie van Hummingbird, het voorjaar van 2013, kregen 3.986 verschillende pagina’s bezoeken vanuit de organische zoekresultaten van Google. Dit betrof een selectie van sterk voor SEO geoptimaliseerde pagina’s, waarbij er veel pagina’s op veel verschillende zoektermen ingericht zijn.

In dezelfde periode in 2014 voor dezelfde pagina’s krijgen nog maar 2.187 verschillende pagina’s bezoeken uit SEO. Dat is 45 procent minder pagina’s (overigens is het totaal aantal bezoekers uit SEO op deze pagina’s gestegen). In dit geval is het aantal pagina’s en de content erop nagenoeg gelijk gebleven.

Voorbeeld 2: reisorganisatie

Ook hier kijk ik naar de periode van een aantal maanden voorafgaand aan Hummingbird. Hier betreft het geen selectie, maar alle pagina’s die vanuit organische zoekresultaten bezoeken krijgen. Voor Hummingbird kregen 7.230 verschillende pagina’s bezoekers uit SEO, terwijl dit na Hummingbird in dezelfde periode 5.975 verschillende webpagina’s waren.

Belangrijk om te weten is dat deze organisatie juist vrij veel pagina’s en content heeft toegevoegd in 2014, wat er in 2013 nog niet was. Dat betekent dat het verschil in feite nog groter is.

Onderzoek levert bewijs

Uitgebreid internationaal onderzoek door Searchmetrics, op basis van vele honderdduizenden keywords, laat duidelijk zien dat deze trend na Hummingbird ingezet is:

hummingbird 9 - domein diversiteit

Afname domein-diversiteit na Hummingbird.

Google heeft Hummingbird waarschijnlijk in week 33 van 2013, medio augustus, in gebruik genomen. Vanaf dat moment neemt de domein diversiteit duidelijk af.

‘Keyword pairs’

In hetzelfde onderzoek van Searchmetrics werd ook gekeken naar ‘keyword pairs’. Oftewel, paren van zoektermen die een sterk vergelijkbare intentie hebben. Het voorbeeld dat ze geven is ‘bang hairstyles’ en ‘hairstyles with bangs’.

Van deze keyword pairs is duidelijk te zien dat het aantal ‘matches’, of overeenkomstige webpagina’s en websites, sterk is toegenomen na Hummingbird:

hummingbird 10 - domein diversiteit

Toename zelfde domeinen voor vergelijkbare zoekopdrachten na Hummingbird

SEO in het Hummingbird-tijdperk

Dat Google nu begrijpt dat verschillende keywords dezelfde intentie hebben, betekent dat je je SEO-activiteiten moet aanpassen. Het alleen maar optimaliseren van webpagina’s op specifieke keywords is met Hummingbird niet genoeg.

Om in de komende jaren succesvol te zijn in SEO, moet je de focus verleggen op het optimaliseren van webpagina’s op basis van de intentie van mensen. Zorg ervoor dat je marktonderzoek doet en zorg dat je de behoeftes en intenties van je doelgroep leert begrijpen. Alleen dan kun je content produceren die hierop aansluit.

Natuurlijk zijn zoektermen nog steeds belangrijk en moet je rekening blijven houden met door jouw doelgroep gebruikte keywords. Maar een zo goed en volledig mogelijk antwoord op de intentie achter de keywords is de komende jaren de succesfactor voor SEO.

Belofte waargemaakt?

De belofte die Google met Hummingbird heeft gedaan, maakt de ‘antwoordmachine’ dus waar. Analyses en onderzoeken tonen aan dat Google steeds beter begrijpt wat de intentie van zoekopdrachten is. Zeker bij zoekopdrachten die sterk op elkaar lijken is duidelijk te zien dat Google na de introductie van Hummingbird steeds vaker dezelfde webpagina’s en websites als antwoord teruggeeft.

Google begrijpt steeds beter wat de intentie is achter zoekopdrachten, waardoor de zoekmachine steeds betere antwoorden kan geven. Google ontwikkelt zich van zoekmachine naar ‘antwoordmachine’. En dat wordt alleen maar meer zichtbaar.

Illustratie intro met dank aan Fotolia.