Innovatie

Paginering, SEO en informatie-architectuur

0

Paginering-systemen; ik gruw ervan. Ze leveren op SEO-gebied eigenlijk vooral problemen op. Maar juist omdat dit soort systemen zoveel gebruikt wordt, zijn er nog enorm veel gemiste kansen. Hieronder vind je een uitgebreid overzicht van de problemen, en draag ik workarounds en oplossingen aan, waarvan je er uiteraard meerdere in combinatie met elkaar kunt toepassen.

Wat is paginering? Links en URL’s

Paginering-systemen herken je aan dit soort linkoverzichten (Google en Frankwatching.com):

paginering google

Het zijn in feite dus altijd ‘volgende’ en ‘vorige’ navigaties, die veelal met links verwijzen naar vervolgpagina’s die bijvoorbeeld de ‘volgende 10 artikelen’ of de ‘volgende 10 zoekresultaten’ tonen.

Pagineringpagina’s hebben meestal ook een URL-structuur waaraan je ze kunt herkennen, bijvoorbeeld URLs als ‘?page=2’ of ‘/archive/2/’, waarbij de ‘2’ staat voor ‘pagina 2’, etc:

voorbeeld paginering-url

Definities

In dit artikel gebruik ik verschillende woorden die enige uitleg nodig hebben. Dit zijn geen officiële definities (ik geloof niet dat die er zijn in deze gevallen), maar het geeft wel aan wat ik met bepaalde termen bedoel:

  • Paginering-systeem: de wijze waarop paginering op een website geregeld is. Uiteraard zijn hier allerlei varianten van.
  • Paginering-pagina: een HTML pagina met daarop verwijzingen naar resultaten. Dat kunnen zoekresultaten zijn, maar bijvoorbeeld ook artikelen (bij een weblog) of reacties (bij een forum).
  • Paginering-resultaten: de resultaten waarnaar verwezen wordt vanaf paginering-pagina’s. Dit kunnen artikelen zijn (op een blog), reacties (bij forums), zoekresultaten (zoekmachines), etc.
  • Beginpagina: de eerste pagina in een paginering systeem. Voorbeelden: pagina 1, de homepage, een categorie pagina, etc.
  • Vervolgpagina: een paginering-pagina die niet de eerste pagina is, maar een paginering-pagina die op de eerste volgt. Voorbeelden: pagina 2, pagina 3, pagina 456, etc.
  • Zachte 404: een landingspagina die de meeste mensen niet geeft wat ze verwachten. Ondanks dat hier geen foutmelding op staat, is het in feite wel een ‘foute’ pagina (vandaar de term ‘zachte 404’).

Problemen paginering

Hieronder een opsomming van de verschillende problemen die paginering-systemen veroorzaken.

Hide & seek

Door URL’s te ontsluiten via een paginering-systeem verstop je feitelijk je oude content. Zowel mensen als zoekmachines moeten teveel stappen doorlopen om URL’s te ontdekken. Dit is een absoluut inadequate manier om (oude) content te ontsluiten.

Hoeveel keer klik jij door bij paginering-links? 2? 5? 25? Content die ver weg zit in een paginering-systeem (dat zijn dus paginering-resultaten, zie de definities), is nauwelijks vindbaar, zowel voor mensen als zoekmachines, omdat iedereen teveel stappen moet zetten om ze te bereiken:

zure pagerank flow dankzij paginering

Je normale pagina’s zijn normaal verdeeld, maar de paginering-resultaten zijn alleen te bereiken via het paginering-systeem. De resultaten waarnaar verwezen wordt krijgen minder en minder linkwaarde en worden dus steeds minder belangrijk. Zonde.

URL-shuffle

Je schrijft een nieuw artikel voor op je weblog. Deze komt fier bovenaan te staan op je homepage. Mooi!

Stel nu dat je telkens de laatste 10 artikelen laat zien. Er is dus een nieuw artikel bijgekomen bovenaan de homepage, en het artikel dat voorheen op de homepage op plek 10 stond, is opgeschoven naar pagina 2. Daar is het nu het eerste artikel geworden. Logisch.

Maar dit ‘opschuiven’ van de artikelen gebeurt niet alleen op je homepage en pagina 2, maar op ALLE paginering-pagina’s van je site. Op al die pagina’s komt er bij ieder artikel dat geplaatst wordt een artikel bij aan de bovenkant van de pagina, en valt er eentje weg naar de volgende pagina. Bij ieder artikel dat erbij komt vinden er dus op alle paginering-pagina’s minimaal twee wijzigingen in de content van die pagina’s plaats (1 erbij, 1 eraf).

Geen opbouw van historie & autoriteit

Er is niks mis met constante updates aan je site. Dat is juist goed! Maar er is wel wat mis mee als dezelfde content telkens op een andere URL staat (vandaar dus de ‘URL-shuffle’). En al helemaal als dit continu op grote schaal gebeurt. Hoe kun je daar überhaupt iets mee opbouwen? Historie? Autoriteit? PageRank? Dacht het niet.

Begrijp me goed. Waar het me om gaat is dat wanneer je eenmaal content op je site gezet hebt, dat je die content op dezelfde URL laat staan. Daar mag van alles bijkomen of gewijzigd worden (zoals verwijzingen naar nieuwsitems of verbeteringen), maar je gaat niet continu de routes naar die content toe wijzigen. Zo is je content niet vindbaar.

Slechte gebruikerservaring

Als ik een zoekmachine was, zou ik mijn bezoekers ook niet naar paginering-pagina’s sturen. De kans is groot dat tegen de tijd dat een bezoeker op zo’n pagina terechtkomt, dat de content waarnaar ze zochten inmiddels weer een paar pagina’s opgeschoven is. Dat is in feite een ‘zachte 404’: mensen vinden niet wat ze zoeken en verlaten veelal direct de site. Een slechte gebruikerservaring dus, en reden voor Google om mensen daar niet naartoe te sturen. Dat gebeurt dus ook nauwelijks.

Ik heb dit op verscheidene sites onderzocht en bevestigd gezien. Je kunt dit voor je eigen site ook snel zien als je in Google Analytics kijkt bij ‘top landing pages’, en vervolgens filtert op ‘medium=organic’. Daarna filter je het URL-patroon van de paginering-pagina’s. In het geval van deze site is dat ‘pn=’:

Het resultaat zal waarschijnlijk ook bij jouw site zoiets als dit zijn: tegen de 6.5% van de traffic op je site komt naar deze pagina’s toe:

Dikke kans dat jouw site ook laat zien dat Google mensen liever niet naar je paginering-pagina’s stuurt.

Zou je je dan hierom nog wel druk maken, vraag je je af? Ja dus. Hoeveel procent van de pagina’s op je site zit in zo’n paginering-systeem? Je kunt het percentage gemiste kansen best goed uitrekenen zo.

Kannibalisatie

De HTML templates van paginering-pagina’s zijn meestal hetzelfde als de beginpagina van het systeem. Dat betekent dus dat de SEO acties die op die templates uitgevoerd worden (zoals metatitles, metadescriptions, eventuele algemene beschrijvingen, sidebars, h1-tags, etc.) ook allemaal hetzelfde zijn. En dus feitelijk met elkaar concurreren om dezelfde keywords. Dat is kannibalisatie.

Hannibal the Cannibal provides the duplicate content!

Kannibalisatie vindt meestal sowieso plaats bij de meta-tags, maar vaak ook bij de artikelen. Niet zelden worden vrij grote delen van artikelen (ankeilers, of soms zelfs volledig) getoond op paginering-pagina’s, terwijl die pagina’s toch vooral bedoeld zijn om hun verwijzende functie. Je zou dit ook een duplicate content issue mogen noemen.

Chronologische groepering i.p.v. thematische

Meestal wordt bij paginering gebruik gemaakt van een chronologische groepering van de artikelen. Nieuwe artikelen staan bovenaan, en een artikel over ‘onderwerp X’ staat boven een artikel over ‘onderwerp 5’. Die twee zullen de rest van hun leven naast elkaar blijven staan, hoe diep ze ook weggestopt zijn in het paginering-systeem.

Dit is een probleem omdat zoekmachines proberen te begrijpen wat het onderwerp is van die pagina. Dat doen ze niet alleen door de tekst zelf te lezen, maar ook door de omgeving te bekijken. Met andere woorden: de content ‘in de buurt’, en in- en uitgaande links.

Als Google de inhoud van het artikel over ‘onderwerp X’ wil leren, zal het ook meenemen wat er staat in het artikel over ‘onderwerp 5’. Je begrijpt dat dat niet bevorderlijk is. Dat geldt des te meer voor websites die over allerlei onderwerpen schrijven.

SEO workarounds: betere paginering

Als je toch paginering wilt blijven gebruiken, dan zou je de onderstaande tactieken kunnen toepassen. Dit zijn workarounds en geen oplossingen. Over het algemeen zijn ze wel goedkoper om te implementeren en lossen ze een van of enkele van de vele paginering-problemen voor een deel op.

De stappen die zoekmachines en gebruikers moeten afleggen, worden groter naarmate de website verder groeit. Een vrij eenvoudige workaround is het om simpelweg ervoor te zorgen dat er minder stappen gezet hoeven te worden door het aantal links in de paginering-navigatie uit te breiden:

Uiteraard werkt dit alleen als je niet al te veel paginering-pagina’s hebt. Vraag je dus af of dit voor jouw site een goede oplossing is, of uitstel van executie.

Meeschuivende paginering

Wat je ook kunt doen is de paginering-links als het ware mee te laten schuiven met de bezoeker, zodat er altijd maar een paar stappen nodig zijn om waar dan ook binnen het systeem te raken. Naast de standaard links die dichtbij zijn bij degene die je op dat moment bekijkt, link je ook naar paginering-pagina’s die een grotere afstand verwijderd zijn. En die laat je ook meeschuiven. Denk bijvoorbeeld aan zoiets als dit:

Maar uiteraard werkt dit ook alleen als je archief niet te groot wordt, en het lost het probleem van de URL-shuffle ook niet op.

Oplopend pagineren

Een elegante workaround is het om in plaats van aflopend de URL’s oplopend te nummeren. Grote voordeel daarvan is dat content op die paginering-URLs altijd hetzelfde blijft.

Wat bedoel ik met oplopend nummeren? Stel, je toont per paginering-pagina telkens 10 artikelen en je hebt een blog. De eerste 10 artikelen die je op je blog publiceert, komen te staan op pagina 1. De URL wordt dan bijvoorbeeld: ‘/blog/1/’. Daar blijven ze ook staan. De volgende tien artikelen (dus 11 t/m 20) komen op pagina 2 (‘/blog/2/’). De artikelen 21 t/m 30 op pagina 3, etc.

Het grote voordeel hiervan is dat wanneer bepaalde content eenmaal op een URL staat, dat die content daar ook blijft staan. Geen URL-shuffle dus.

Er zit ook een nadeel aan, want dit systeem is niet erg schaalbaar. Stel nu dat je een site hebt met 100.000 artikelen. Dan krijg je best wel een grote nummering.

Dit systeem werkt het beste op forums, of bijvoorbeeld als paginering-systeem voor blogs met heel veel reacties. Sommige forum-topics hebben veel reacties, en andere niet. De forum-topics die veel reacties hebben, hebben een oplopende nummering van paginering-URL’s. Maar het grote voordeel daarbij is dat zo’n paginering-systeem altijd lokaal is: het blijft beperkt tot een specifiek topic. Een voorbeeld van waar dit goed werkt is het Viva forum.

Noindex,follow

Hoewel Google waarschijnlijk zelf al nauwelijks mensen naar je paginering-pagina’s stuurt, wil je eigenlijk dat er helemaal geen mensen op landen. Daarnaast is het ook niet de bedoeling dat die pagina’s als landingspagina dienen. Ze zijn bedoeld als verwijzing, en wel als verwijzing naar de paginering-resultaten (zoekresultaten, artikelen, reacties, etc) die erop staan. Het gaat dus niet om die pagina’s zelf, maar om datgene waarnaar ze verwijzen.

Er is een mooie meta-tag die je daarvoor kunt gebruiken: de robots meta-tag:

<meta name="robots" content="noindex,follow" />

Deze plaats je op alle paginering-vervolgpagina’s (en dus NIET op de eerste pagina).

Let op: dit is natuurlijk niet nodig als je de oplopende paginering optie gebruikt (zoals bij veel forums het geval is).

Wat je hiermee in feite tegen de zoekmachines zegt, is: “Toon deze pagina’s niet in je index (oftewel: zoekresultaten), maar volg wel de links die op deze pagina’s staan.” Als je voorbeelden zoekt zou je eens kunnen kijken op Goeievraag.nl en Styletoday.nl.

Andere lay-out

Als je je realiseert dat vervolgpagina’s een andere functie hebben dan de eerste pagina, dan is het eigenlijk al logisch dat deze pagina’s een andere HTML-template en lay-out moeten krijgen. Dat kan al zo eenvoudig zijn als het wijzigen van de title-tag:

Denk aan wijzigingen in: meta-title, meta-description, H1-kop, begeleidende tekst, hoeveelheid links, grootte van artikel ankeilers, etc.

SEO-oplossingen: alternatieven

In plaats van je artikelen te ontsluiten via paginering-systemen, kun je ook denken aan categorisatie. In plaats van een vrij onintelligent ‘volgende-vorige’ systeem, ga je je content inhoudelijk ordenen. Als je site-tags/categorieën gebruikt ben je trouwens al een heel eind op weg.

Meer categorieën

In deze video wordt een methode uitgelegd die voor de meeste sites wel zal helpen: in plaats van paginering maak je meer (sub-)categorie pagina’s aan en plaats je ook meer links op die pagina’s. De linkoverzichten op die pagina’s kunnen in theorie behoorlijk groot worden, maar meestal valt het mee, zoals op mijn eigen blog in de categorie seo:

Mijn categoriepagina’s stellen (nog) niet veel voor, ik weet het, maar waar het om gaat is dat de groepering hier duidelijk is: de artikelen gaan allemaal over SEO, en ze zijn ook heel goed bereikbaar. Er komen links bij zodra ik nieuwe artikelen over dit onderwerp schrijf, maar er vindt geen URL-shuffle plaats.

‘Populair’-links

Sommige URL’s zijn belangrijker dan andere. Door daarin geen onderscheid te maken, ga je uiteindelijk, hoe dan ook, je beste artikelen langzamerhand allemaal wegstoppen.

Om dat te voorkomen moet je dus op categoriepagina’s niet alleen een opsomming geven van de artikelen, maar ook extra aandacht besteden aan de meest populaire, aan de artikelen die het hoogst gewaardeerd zijn, etc. Bij blogs zie je dit concept vaak wel terugkomen (bijvoorbeeld op de homepage van https://www.geenstijl.nl/ met de Stijlloze Klassiekers), maar onvolledig omdat bijvoorbeeld alleen maar de vijf meest populaire artikelen van de site als geheel getoond worden.

Als je dat dus ook gaat doen voor categoriepagina’s, dan zorg je daarmee ervoor dat de artikelen die binnen die categorie het belangrijkst zijn, ook de meeste aandacht (en linkwaarde) krijgen. Dus op de beginpagina van een tag of categorie plaats je dan ook weer een overzicht van ‘meest populair binnen categorie X’. Voor een voorbeeld zou je eens kunnen kijken bij de lcd tv categorie op Kieskeurig. Daar zie je overzichten met ‘hoogst gewaardeerd’ en ‘meest populair’.

Chronologisch archief

Op (WordPress) blogs zie je dit vaak terug: op de URL /archief/2010/ zie je alle artikelen staan die in 2010 gepubliceerd zijn. Een artikel dat in 2011 geschreven is komt te staan op /archief/2011/, etc. Als je een grote site hebt met duizenden artikelen per jaar, dan kun je overwegen om geen jaaroverzichten te maken, maar een indeling per maand. Bij gebrek aan beter noem ik dit een ‘chronologisch archief’.

Dit heeft als grote voordeel dat je geen URL-shuffle meer krijgt en ook dat dit systeem een stuk schaalbaarder is. Je zou dit ook kunnen indelen per dag, indien nodig.

Groot nadeel is dat er nog steeds sprake is van een chronologische groepering van artikelen: een artikel over ‘onderwerp X’ staat naast het artikel over ‘onderwerp 5’, en zal daar ook blijven staan. Als je artikelen telkens over hetzelfde onderwerp gaan, hoef je je uiteraard niet druk te maken:

Chronologisch archief per categorie/tag

Maar stel nu dat je een enorme site hebt die handelt over allerlei onderwerpen (zoals een algemene nieuwssite). Het aantal artikelen dat je schrijft is te groot voor een simpel chronologisch archief, en daarnaast lopen je onderwerpen ook teveel uiteen.

In zo’n geval zou je voor een combinatie kunnen gaan: per tag (of categorie) maak je een archief aan dat weer op chronologie verder geordend is. De URL-structuur wordt dan zoiets als dit: /archief/seo/2011/ waarbij ‘SEO’ de naam van de categorie is. Op deze URL vind je alle artikelen uit 2011 die over het onderwerp ‘seo’ handelden. Inhoudelijk gezien passen ze dus goed bij elkaar, en ze blijven permanent op dezelfde plek in het archief staan.

Samenvatting

De draad inmiddels kwijt? Geen nood! Hieronder een schematische samenvatting van het hele artikel. Je krijgt drie tabellen van me:

Download artikel als whitepaper

Print je dit artikel liever uit? Download dan het volledige artikel als whitepaper op mijn site. Succes met het aanpakken van deze problemen!