SEO

Wat je kunt leren van de 17k+ uitgelekte rankingfactoren van Yandex

0

Stel, je opent je laptop en ontdekt dat je met één klik alle rankingfactoren van Google zomaar kunt inzien? Ik zou eerst een rolberoerte krijgen van blijdschap. Direct daarna zou ik mij realiseren dat mijn job in een klap nutteloos is geworden. Dit is (gelukkig) fictie. Maar, eind januari 2023 vond wel iets dergelijks plaats bij het grootste Russische techbedrijf Yandex. Met een politiek motief dumpte een boze ex-werknemer de broncode van het gehele bedrijf als torrent op het internet.

Hierin bevonden zich ruim 17.800 rankingfactoren van Yandex Search (eerst bleken dit er 1.922 te zijn). Na Google, Bing en Yahoo! is Yandex Search de op 3 na grootste zoekmachine ter wereld.

Het aantal factoren deed mij duizelen en riep direct ongeloof op over het door Google geopperde aantal van 200. Hedendaagse zoekmachines zijn achter de schermen monsterlijk veel groter dan werd gesuggereerd.

Waarom interessant?

Hoewel Yandex geen Google is, biedt dit datalek een unieke kijk in hoe een moderne en professionele zoekmachine werkt. Het is namelijk bekend dat er oud-Google Search werknemers bij Yandex Search werken.

Daarnaast maakt Yandex Search ook gebruik van Google’s open source algoritmes BERT, TensorFlow en MapReduce. Hiermee laat Yandex zien dat ze Google’s zoekmachine hoog in het vaandel hebben staan. Kortom, deze data zijn goud waard voor iedere SEO’er die tijdelijk meer grip wil krijgen op een constant evoluerende industrie.

Hoe werkt Yandex Search dan?

De complete werkwijze van Yandexs zoekalgoritme zelf is niet uitgelekt. De complexe rekensommen, die bepalen wie er uiteindelijk op 1 of 10 staat, maken wel gebruik van de rankingfactoren die onlangs zijn uitgelekt. Door die factoren van Yandex met gezond verstand door te spitten, kun je op waardevolle inzichten komen. Dit gaan we nu dan ook doen.

Hoe analyseer je de uitgelekte factoren?

Direct na de bekendmaking van het euvel bij Yandex stond de SEO-community op Twitter even op z’n kop. “Hier moeten we snel wat mee,” dacht iedereen. Binnen enkele dagen werden online tooltjes in elkaar gezet om de data te rangschikken. Ik gebruik nu deze tool van Index Garden. Marketingman en techneut Rob Ousbey heeft de alternatieve tool Yandex Search Ranking Factor Explorer gemaakt, maar deze navigeert iets minder fijn vind ik.

Hieronder leg ik met 2 manieren uit hoe je de Index Garden-tool gebruikt om de factoren efficiënt te bekijken. Hier kun je ook een video bekijken.

Introductie tool

De tool is minimalistisch en ‘leest’ in 3 kolommen van links naar rechts. Links in beeld kun je vakjes aanvinken waarvan je de rankingfactoren wil zien. De eerste reeks vakjes staan voor groepen (zoals Domain of Query), en daaronder vind je tags.

In het midden vind je de rankingfactoren die horen bij de vakjes die je aangevinkt hebt. Rechts in beeld lees je de details van iedere factor.

uitleg tool ranking factoren yandex

Manier A

Zoek in het zoekveld (middenbovenaan) op trefwoorden zoals ‘bad, good, low, high, commercial, best, user’ om factoren te vinden die waarschijnlijk direct aangeven of iets goed of slecht is.

Manier B

Vink de vakjes aan die jou interessant lijken en scrol vervolgens door de weergegeven factoren in het midden. Lees de omschrijvingen.

Kleine greep uit de factoren

De afgelopen dagen heb ik me verdiept in die tool en heb ik er een reeks interessante factoren uitgehaald. De volgende zal ik bespreken:

  1. Zoekterm alléén in URL
  2. Wel/geen Yandex-advertentie
  3. CGI in URL
  4. Oude datum in URL
  5. Pro Moskou
  6. Gedrag bezoekers op commerciële sites
  7. Commercieel taalgebruik
  8. Gemarkeerde zoekterm
  9. Commerciële backlinks
  10. Meer content is beter

1. Zoekterm alléén in URL

Factor 214 bespreekt de situatie waarbij de zoekterm alleen in de URL te vinden is en niet in de tekst van de pagina. Uit de data is niet met 100% zekerheid te achterhalen of dit goed of slecht is. Mijn interpretatie is dat dit niet goed is. Het zorgt immers voor een discrepantie. De meeste SEO’ers doen dit al goed, maar het is wellicht iets om op te letten.

2. Wel/geen Yandex-advertentie

Factor 50 en 51 laten zien dat wordt gecheckt of er advertenties op de pagina staan. Vervolgens wordt er gecheckt of deze van Yandex zijn of van een derde partij. Dit suggereert dat het een beter is dan het ander. Met het gebruik van advertenties van de zoekmachine zelf zou dit dus een streepje voor kunnen betekenen. Of dit ook voor Google geldt weten we niet zeker.

3. CGI in URL

Het gebruik van CGI (Common Gateway Interface) in een URL is een rankingfactor (899). Bijvoorbeeld: heyrene.nl/?p=123 Hierbij wordt de URL gescheiden van de GET-parameter. Dit soort niet-statische URL’s roepen via een script (bv. Python) content op en lijken minder gunstig voor rankings. Een statische URL (bijvoorbeeld: heyrene.nl/123/) zonder vreemde tekens zoals ‘?’ is beter te indexeren (en te cachen) door zoekmachines.

4. Oude datum in URL

Factor 198 vertelt ons dat een datum in de URL van vóór 2007 invloed heeft bij Yandex. Het is een simpele manier voor een zoekmachine om te interpreteren dat content verouderd is. Ik verwacht ook dat er een user experience-argument aan gekoppeld is. Vernieuwde content op een ogenschijnlijk verouderde URL kan nieuwe bezoekers afschrikken. Ik zie nog regelmatig websites die een oude datum in de URL van hun pagina’s gebruiken.

5. Pro Moskou

Deze is bizar. Factor 726 lijkt commerciële pagina’s gelieerd aan Moskou een boost te geven in rankings. Misschien geen verrassing als je erover nadenkt, maar om dit zwart op wit te zien, vind ik wel heftig. Wat betekent dit voor websites uit andere steden en landen?

Yandex

Bron: Varavin88 / Shutterstock.com

6. Gedrag bezoekers op commerciële sites

Van het feit dat zoekmachines het gedrag van bezoekers op pagina’s volgen/meten, kijken niet veel mensen op. Dat Yandex commerciële websites onderscheidt van niet-commercieel in factor 704 vind ik wel weer interessant. Dit suggereert dat commerciële websites een andere ‘treatment’ krijgen dan louter informatieve niet-commerciële websites.

7. Commercieel taalgebruik

Een volgens Yandex niet meer gebruikte verouderde factor (134) heet ‘Is SEO’. Deze vind ik het vermelden waard omdat deze pagina’s met commerciële titels classificeerde. Denk aan het gebruik van de woorden Sale, Cheap, Buy Now, en misschien ook ‘10 Best…’ en ‘10 Tips…’. Hoe ze hier toen mee omgingen is onduidelijk. Het is ook opmerkelijk dat deze factor niet meer actief is. Wellicht is deze omgedoopt met een nieuwe benaming.

8. Gemarkeerde zoekterm

Het dik of schuin maken van zoektermen in de tekst is een verouderde SEO-tactiek die wel allemaal nog wel kennen. Het is bijzonder om te zien dat dit een als rankingfactor (351) is opgenomen bij Yandex. Er staan geen ‘Unused’- of ‘Depreciated’-tags bij dus deze is nog actief. Het kan zijn dat dit als negatief wordt gezien in plaats van positief. Dat kunnen we helaas niet inzien.

9. Commerciële backlinks

Factor 158 neemt bij het bepalen van de relevantie van een backlink mee hoe commercieel en gethematiseerd de backlink is. Hoe ze dit bepalen en wat precies wordt gezien als een commerciële backlink wordt niet duidelijk. Hiermee lijkt het er op dat de inhoud rondom een backlink niet de enige graadmeter is om de relevantie van een backlink te bepalen. Hoe commercieel de content is waarin de link zich bevindt, speelt ook mee.

10. Meer content is beter

Deze factor (15) geeft een pagina een hogere waarde dan de concurrentie, zodra de omvang hiervan groter is. Hoe meer content, hoe beter zou je kunnen zeggen. Dit lijkt onnodig aangezien een antwoord op een vraag niet altijd veel woorden nodig heeft. Maar, wellicht krijgt dit korte antwoord meer waarde wanneer er meer extra context omheen te zien is. Het kan ook zijn, dat deze factor pas weegt in relatie tot andere factoren en zoektermen die specifiek vragen om een uitgebreide pagina (zoals ‘best of’- en ‘how to’-artikelen).

Weer even op scherp gezet

Eén week na het enerverende datalek is mijn hartslag weer stabiel. Voor een ervaren SEO-specialist zijn de meeste factoren toch eerder een bevestiging dan een openbaring. En, Yandex is zeker geen Google, dus over de échte ‘golden nuggets’ uit ‘s werelds allergrootste zoekmachine kunnen we slechts blijven dromen.

Desalniettemin heb ik voldoende factoren gevonden die mijn gedachten weer op scherp hebben gezet. Daarnaast heb ik een waardevol inzicht gekregen in hoe de ‘architecten’ achter zo’n zoekmachine denken om een zoekalgoritme in te richten. Dit kan houvast geven bij het maken van mijn volgende SEO-beslissing.

Bron header-afbeelding: IB Photography / Shutterstock.com