Lesedauer: ungefähr 4 Minuten

Duplicate Content - Verwirrung im World Wide Web und wie sie vermieden werden kann

Duplicate Content, im Deutschen einfach als doppelte Inhalte bezeichnet, schadet der Rankingposition bei Suchmaschinen und verwirrt neben den Crawlern von Google & Co. auch die privaten User - ist also in mehrfacher Hinsicht äußerst wichtig für die SEO. In der Praxis sollten Website-Betreiber Duplicate Content unbedingt vermeiden, um langfristig erfolgreich im Internet zu agieren.

Was ist Duplicate Content?

Der Begriff Duplicate Content, oftmals auch mit DC abgekürzt, bezeichnet im Bereich des Online Marketings Informationen in Textform, die über mehrere URL’s erreichbar sind. Kurzum - der gleiche Inhalt ist unter verschiedenen Links abrufbar. Damit besteht für einen spezifischen Content, der ja im Optimalfall einen Mehrwert für den Kunden liefert, kein eindeutiger Pfad, was zu mannigfaltiger Verwirrung führen kann. Es gibt zwei Formen von doppeltem Content: internen und externen. Während interner Duplicate Content innerhalb der eigenen Website entsteht - eigene Informationen also unter mehreren Links innerhalb der eigenen Domain zu finden sind - ist externer Duplicate Content domainübergreifend. Folgende zwei Beispiele vermitteln ein klares Verständnis für doppelten Content:

  • ein Onlineshop verlinkt dasselbe Produkt auf verschiedenen Subdomains (intern)
  • ein Unternehmen nutzt mehrere Domains und verwendet keinen 301 Redirect, um die identischen Inhalte auf die Hauptdomain umzuleiten (extern)

Ursachen und Konsequenzen von doppeltem Content

Der negative Einfluss von Duplicate Content auf die SEO Suchmaschinenoptimierung fällt nicht immer auf Anhieb auf, kann langfristig aber gravierende Auswirkungen haben. Hauptursache dafür ist, dass die Suchmaschinen - vor allem Google - mit doppelten Inhalten Indexierungsprobleme bekommen. In diesem Moment kann Google nicht zuordnen, welche der URLs den relevantesten Inhalt für den Nutzer bietet und ist, bildlich gesprochen, verwirrt. Mit dem Hauptziel, jedem User einen Mehrwert durch das Internet zu schaffen, will die Suchmaschine Duplicate Content vermeiden. In der Konsequenz kommt es zu Schwankungen der Webseite in den Suchergebnissen und bei der Rankingposition. Die Performance der Website wird über einen längeren Zeitraum schlechter. In vorsätzlichen Fällen kann es auch zur Abstrafung oder sogar zum Ausschluss von der Indexierung kommen. Damit existiert die Webseite für den Nutzer quasi nicht mehr und wird nahezu unsichtbar. Doppelte Inhalte entstehen primär durch das Kopieren von Informationen, aber auch durch OnPage-Optimierungsfehler in der Programmierung der Webseite. Diebstahl und Content-Klau ist zwar mittlerweile seltener, fällt den betroffenen Urhebern jedoch leider meist zu spät auf.

Duplicate Content vermeiden

Da vor allem interne doppelte Inhalte zu Problemen führen, können Webseitenbetreiber durch einfache Maßnahmen selbst entgegenwirken. Grundregel Nummer 1 ist dabei vor allem für Onlineshops, Produktbeschreibungen, Webseiten-Inhalte und Informationen aus zweiter Hand selbst neu zu formulieren. Das bedeutet zwar einen erhöhten Zeitaufwand, erspart auf der anderen Seite aber die kostspielige Rettung aus der Duplicate Content Falle. Dabei können Content-Management-Systeme sehr hilfreich sein, die oft automatisch alle Inhalte auf Dopplungen prüfen. Eine klare Struktur der URLs gehört ebenfalls zu den grundlegenden Maßnahmen. So sollte jede Seite der URL über die gleiche Link-Struktur erreichbar sein. In der Praxis bedeutet das, sich entweder für www.domain.de, domain.de, domain.de/ oder domain.de/index zu entscheiden, um nur einige Beispiele zu nennen. Wenn jede Unterseite dem gleichen Aufbau folgt, hat interner Duplicate Content nahezu keine Chance. Zu guter Letzt kommt es nicht selten vor, dass ein Unternehmen die URL wechselt, eine zweite eröffnet oder auf eine neue Domain umzieht. Hier reicht es meist schon, durch korrekt gesetzte 301 Redirects doppelte Inhalte zu vermeiden. Diese führen den „alten“ Inhalt eindeutig auf die neue URL und übertragen somit auch das SEO Ranking auf die neue Seite.

Der Canonical-Tag - wenn Duplicate Content unvermeidbar ist

Der Canonical-Tag wird eingesetzt, um Webseiten mit zwangsläufig doppeltem Inhalt zu kennzeichnen. Im Header des Quelltextes kann der Tag innerhalb eines Link-Elements mit dem Attribut rel=“canonical“ gesetzt werden. So werden die einzelnen Seiten, die identische Inhalte oder Informationen enthalten, auf das Original verlinkt. Die Ursprungsseite wird somit zu einer kanonischen URL. Wird eine Website, beispielweise ein Online-Shop für Schuhe, von einem Bot gescannt und enthält sie einen Canonical-Tag, erkennt der Crawler, dass die verlinkte Seite, beispielsweise die Grundvariante eines Schuhs, das Original ist und er die verlinkenden Webseiten, wie Produktbeschreibungen verschiedener Farbvarianten des Schuhs, im Hinblick auf Duplicate Content ignoriert werden können. Außerdem werden durch die Suchmaschine wie bspw. Google Eigenschaften wie etwa PageRank auf das Original übertragen. Der Canoncial-Tag ist also ein bedeutsames Werkzeug für die OnPage Optimierung einer Website und hilft, Fehler in der Bewertung von Content zu vermeiden.

Die Suchmaschinen sind mittlerweile auch in der Lage, ungewollten Duplicate Content selbst zu identifizieren und das Problem zu lösen. Google beispielsweise hält sich jedoch offen, in Einzelfällen selbst einzuschätzen, inwiefern die doppelten Inhalte mutwillig entstanden sind. Um diesem Prozess zu entgehen, ist es deshalb ratsam, die eigene Webseite durch Online-Tools auf Duplicate Content zu testen und nicht den Suchmaschinen die Entscheidung zu überlassen.