De term 'dubbele inhoud' verwijst naar informatie die op meer dan één online locatie te vinden is. Die 'ene locatie' is een locatie met een URL . Je hebt dus te maken met hetzelfde materiaal als identieke inhoud op meer dan één webadres voorkomt.
Hoewel het strikt genomen geen straf is, kan het dupliceren van materiaal soms wel van invloed zijn op de positie van een website in zoekmachines. Wanneer veel materiaal "aanzienlijk op elkaar lijkt", zoals Google het omschrijft, en op meerdere plekken op internet te vinden is, kan het voor zoekmachines lastig zijn om te bepalen welke versie relevanter is voor een bepaalde zoekopdracht.
Hoe ontstaan problemen met dubbele content?
Meestal produceren website-eigenaren niet opzettelijk duplicaatmateriaal voor hun sites. Dit betekent echter niet dat het niet voorkomt. Volgens sommige schattingen is maar liefst 29 procent van het materiaal op het internet duplicaat!
Laten we eens kijken naar enkele van de meest voorkomende manieren waarop hetzelfde materiaal kan worden gemaakt zonder medeweten van de auteur:
URL-varianten
URL-parameters, zoals die gebruikt worden voor klikregistratie en analysecode, kunnen soms leiden tot problemen met dubbele content. Dit probleem kan niet alleen worden veroorzaakt door de parameters zelf, maar ook door de volgorde waarin die parameters in de URL voorkomen.
Ook sessie-ID's zijn een van de meest voorkomende oorzaken van duplicatie van content. Dit gebeurt wanneer een unieke sessie-ID voor elke gebruiker die een website bezoekt, in de URL wordt opgeslagen. Deze ID wordt individueel aan elke gebruiker toegekend.
Het is mogelijk om dubbele content te genereren met behulp van sessie-ID's of parameters.
Wanneer er meerdere kopieën van een pagina worden geïndexeerd, zoals kan gebeuren bij het gebruik van printvriendelijke versies van materiaal, kan dit leiden tot problemen met het dupliceren van inhoud.
Een belangrijke les die we hieruit kunnen trekken, is dat het, waar mogelijk, doorgaans het beste is om geen URL-parameters of verschillende versies van URL's toe te voegen (de informatie in die containers kan meestal via scripts worden doorgegeven).
Inhoud die is gekopieerd of gedupliceerd
De content bestaat niet alleen uit blogberichten en journalistiek materiaal, maar ook uit informatiepagina's over producten. Het kopiëren van blogmateriaal van andere websites is misschien wel de bekendste bron van dubbele content; een andere veelvoorkomende bron van identieke content voor e-commercewebsites is echter productinformatie. Wanneer veel verschillende websites dezelfde producten aanbieden en allemaal de productbeschrijvingen van de fabrikant gebruiken, wordt hetzelfde materiaal via internet op verschillende plekken verspreid.
Hoe lossen we problemen met dubbele content op?
Het oplossen van problemen met dubbel materiaal komt altijd neer op hetzelfde fundamentele concept: vaststellen welke kopieën de "juiste" versie van de informatie bevatten.
Het is essentieel om informatie op een website te canoniseren voor zoekmachines als deze via meerdere URL's toegankelijk is. Laten we de drie meest voorkomende methoden bespreken: een 301-redirect naar de juiste URL, het attribuut `rel=canonical` of de parameterbeheerfunctie in Google Search Console.
Zie Seahawk Media voor meer van dergelijke artikelen.