7 Ursachen für doppelte Inhalte und wie man sie behebt (+ Beispiele)

7 Ursachen für doppelte Inhalte und wie man sie behebt (+ Beispiele)

- • SEO

Die Beseitigung doppelter Inhalte ist je nach Ursache ein relativ schneller Erfolg, der Ihren organischen Traffic steigern kann. Die meisten dieser Probleme sind auf unbeabsichtigte technische Fehler zurückzuführen, die Sie eine Menge Geld kosten können, wenn sie nicht behoben werden.

In diesem Artikel führen wir Sie durch einen schnellen Prüfungsansatz, um URLs zu finden, die von Problemen mit doppelten Inhalten betroffen sind, diese zu beheben und einen inhaltlichen Ansatz vorzuschlagen, um Ihre Website in Zukunft frei von doppelten Seiten zu halten.

Was ist doppelter Inhalt bei SEO?

Laut Google bezieht sich "doppelter Inhalt im Allgemeinen auf substanzielle Inhaltsblöcke innerhalb oder über Domains hinweg, die entweder vollständig mit anderen Inhalten in derselben Sprache übereinstimmen oder erkennbar ähnlich sind. Meistens handelt es sich dabei nicht um betrügerische Inhalte".

Es ist wichtig, dieses Konzept nach den Parametern von Google auszurichten, denn per Definition können wir ungewollt Probleme bekommen, auch wenn wir nicht aktiv Inhalte aus anderen Quellen kopieren. Und das kann selbst dann passieren, wenn sich die Seiten zu sehr ähneln, z. B. wenn mehrere URLs auf eCommerce-Websites auf verschiedene Varianten desselben Produkts verweisen.

Duplizierter Inhalt und SEO

Am wichtigsten ist jedoch, dass wir uns um doppelte Inhalte kümmern, weil sie echte Konsequenzen für unsere SEO-Leistung haben. Insbesondere verursacht er alle Arten von Indizierung und Backlink-Verwässerung.

Wenn Google zwei oder mehr Seiten als Duplikate betrachtet, wählt es aus, welche die Originalversion ist, und ignoriert die übrigen Seiten, was bedeutet, dass weniger Seiten indexiert werden und weniger Ranking-Möglichkeiten bestehen.

Außerdem kann es gut sein, dass Google eine unerwünschte URL voller Parameter und Filter für seinen Index auswählt, so dass Sie mit einer nicht optimierten Version der Seite konkurrieren müssen.

Darüber hinaus können doppelte Inhalte, insbesondere wenn Ihre Website viele davon erzeugt, Ihrem Backlink-Profil schaden. Da "derselbe" Inhalt unter verschiedenen URLs untergebracht ist, können mehrere Nutzer, die Ihre Inhaltsstücke als Ressource nutzen, auf mehrere verschiedene Seiten verlinken, um auf dieselben Informationen zu verweisen. Anstatt dass alle Backlinks auf eine Seite verweisen und Autorität gewinnen, können Sie am Ende Backlinks auf mehrere Seiten aufteilen und so Ihren Link-Saft verwässern.

Warnung: Wenn Sie Inhalte von anderen Websites kopieren oder versuchen, den Algorithmus zu manipulieren, indem Sie dieselbe Seite erstellen, aber mit einer Variation des Hauptkeywords, kann Google so weit gehen, Ihre Website zu bestrafen.

Wie man doppelte Inhalte findet [Tools und Vorgehensweise]

Bevor wir unsere Websites reparieren, müssen wir die Probleme finden. Es gibt zwar viele Methoden, die Sie anwenden können, aber hier ist ein einfacher Ansatz, den Sie verwenden können:

1. Überprüfen Sie die Registerkarte "Abdeckung" in der Google Search Console

Gehen Sie in der Search Console auf die Registerkarte "Abdeckung", und aktivieren Sie das Kontrollkästchen "Ausgeschlossen".

Registerkarte "Abdeckung" der Google-Suchkonsole

Es werden Ihnen mehrere Berichte mit allen betroffenen Seiten angezeigt, die in Kategorien gegliedert sind. Wenn Sie zu viele Arten von Problemen haben, können Sie diese Liste nach dem Typ "Duplikat" filtern.

Suchkonsolen-Duplikatfilter

Obwohl es in unserem Fall nur einen Typ gibt, sind die Hauptkategorien, die Sie für doppelte Inhalte sehen werden, folgende:

  • Duplikat ohne benutzerdefiniertes kanonisches Verzeichnis
  • Duplikat, Google wählte einen anderen Canonical als der Benutzer
  • Duplikat, übermittelte URL nicht als kanonisch ausgewählt

Überprüfen Sie diese Berichte, um sicherzustellen, dass keine URLs ohne Absicht ausgeschlossen wurden.

2. Prüfen Sie auf exakte Duplikate und Beinahe-Duplikate mit Screaming Frog

Standardmäßig sucht Screaming Frog nach exakten Duplikaten, aber Sie müssen die Überprüfung auf Beinahe-Duplikate manuell anfordern. Gehen Sie in Screaming Frog zu Konfiguration > Inhalt > Duplikate und markieren Sie die Checkbox wie im Bild unten gezeigt.

screaming frog exact und near duplicates

Sie können auch den Schwellenwert für die Ähnlichkeit ändern, wenn Sie möchten, dass Inhalte mit einem geringeren Prozentsatz an Ähnlichkeit erkannt werden. Dennoch sind 90 % in den meisten Fällen die beste Option.

Klicken Sie nach dem Crawlen auf die Registerkarte "Inhalt" und wählen Sie im Dropdown-Menü die Option "Genaue Duplikate" aus. Sie erhalten einen vollständigen Bericht mit allen Seiten, die von HTML bis Text exakt gleich sind.

Bericht über exakte Duplikate

Für weitere Details klicken Sie auf die URL, die Sie überprüfen möchten, und wechseln Sie zur Registerkarte Duplikat-Details im darunter liegenden Fenster, um alle URLs zu sehen, die ein exaktes Duplikat der ausgewählten URL sind.

Registerkarte "Details duplizieren

Wenn wir jedoch den Bericht "Beinahe-Duplikate" aufrufen, enthält er nichts. Das liegt daran, dass Sie nach dem Crawlen eine Crawl-Analyse durchführen müssen, um den Bericht zu füllen.

Crawl-Analyse füllt den Bericht über Beinahe-Duplikate

Es wird eine Weile dauern, aber Sie werden sehen, wie der Bericht gefüllt wird, während Screaming Frog die Übereinstimmungen findet.

screaming frog near duplicates report

Außerdem wird der Prozentsatz der Ähnlichkeit angegeben, und auf der Registerkarte "Duplikatdetails" wird ein Ausschnitt des Inhalts der verglichenen Seiten angezeigt.

Registerkarte "Duplikatdetails" zeigt Inhaltsausschnitte

Etwas, das Sie beachten sollten, ist, dass Screaming Frog nur Daten von indizierbaren URLs abruft. Wenn Sie also Canonicals haben, werden diese Seiten nicht zu den Berichten hinzugefügt, selbst wenn es sehr ähnliche Seiten sind.

In den meisten Fällen ist das ja auch gewollt. Bei der Prüfung auf doppelte Inhalte dürfen wir jedoch nicht vergessen, dass mehrere Seiten mit demselben Inhalt auch eine Verschwendung des Crawl-Budgets darstellen.

Wenn wir das Crawl-Budget unserer Website optimieren wollen, indem wir ähnliche Seiten zusammenführen, müssen wir nur zu Konfiguration > Inhalt > doppelter Inhalt gehen und die erste Option deaktivieren.

ähnliche Seiten zusammenführen, um das Crawl-Budget der Website zu optimieren

Um die Daten abzurufen, gehen Sie zu Bulk-Export und wählen Sie die einzelnen Berichte aus.

Bulk-Export von Beinahe-Duplikaten

3. Nutzen Sie Siteliner für eine schnelle Duplicate Content Analyse

Für diejenigen, die gerade erst in das Feld einsteigen oder mit einer relativ kleinen Website (unter 250 Seiten) arbeiten, können Sie ein Tool wie Siteliner verwenden.

siteliner Analyse von doppeltem Inhalt

Sie können Ihre Website einmal im Monat kostenlos analysieren und erhalten so einen guten Einblick in Ihre doppelten Seiten und defekten Links und können einen Vergleich mit ähnlichen Websites anstellen.

siteliner Vergleich doppelter Seiten und defekter Links

Obwohl es nicht direkt mit doppelten Inhalten zu tun hat, kann es Ihnen helfen, ähnliche Probleme wie dünne Seiten oder Probleme mit der Seitengeschwindigkeit zu finden.

Im Bericht über doppelte Inhalte zeigt Ihnen das Tool den Prozentsatz der Ähnlichkeit und die Anzahl der übereinstimmenden Seiten an. Sie können die Daten zur weiteren Analyse als PDF- oder CSV-Datei exportieren.

Prozentuale Übereinstimmung der Ähnlichkeitsseite

7 Ursachen für doppelte Inhalte auf Ihrer Website und wie man sie behebt

wie man Probleme mit doppeltem Inhalt löst

Jetzt, da wir wissen, wie wir nach den Daten suchen müssen, ist es an der Zeit, die Probleme zu beheben und unsere SEO-Leistung zu verbessern.

Es gibt viele verschiedene Ursachen für Probleme mit doppelten Inhalten, und jede davon erfordert eine andere Lösung. Um das Verständnis zu erleichtern, listen wir die häufigsten Situationen auf, die Sie vorfinden, und bieten für jede eine Lösung an.

Wenn Sie eine Lösung für Ihr Problem in dieser Liste nicht finden können oder Sie denken, dass wir sie erwähnen sollten, kontaktieren Sie uns bitte über Twitter, damit wir sie in die Liste aufnehmen und das Wissen mit der Branche teilen können.

1. Mehrere URL-Versionen sind indizierbar und zugänglich

Eines der häufigsten Probleme sind verschiedene Versionen Ihrer URLs, die zugänglich sind und indiziert werden. In diesen Fällen kann es dazu kommen, dass Leute von verschiedenen Versionen auf Ihre Seite verlinken - das ist schlecht für die Link-Equity.

Hier sind die drei Konventionen, mit denen Sie arbeiten werden:

  • HTTP vs. HTTPS
  • www vs. Nicht-wwww
  • Kein nachgestellter Schrägstrich vs. nachgestellter Schrägstrich

Das erste Problem löst sich von selbst, da Sie HTTPS verwenden sollten, aber bei den anderen beiden geht es eher um Einstellungen. Wichtig ist, dass Sie die gesamte Website einheitlich gestalten und eine 301-Weiterleitung von allen anderen Versionen auf die von Ihnen verwendete Konvention einrichten.

Nehmen wir unsere Website als Beispiel:

URL-Versionen mit und ohne www https und Schrägstrich am Ende

Heutzutage spielt der abschließende Schrägstrich keine so große Rolle mehr und ist eher eine Frage der persönlichen Vorliebe. Wir verwenden den abschließenden Schrägstrich gerne, da er sauberer wirkt und unseren Autoren eine geistige Notiz gibt, da sie ihn als Endpunkt für URLs verwenden.

Hinweis: Eine weitere häufige Ursache für doppelte Inhalte ist die Verwendung von Groß- und Kleinbuchstaben in unterschiedlichen Momenten für dieselbe URL. Bei URLs wird zwischen Groß- und Kleinschreibung unterschieden, daher müssen Sie sich für eine Konvention entscheiden und diese beibehalten. Technisch gesehen gibt es keinen Vorteil, wenn man die eine oder die andere verwendet, aber es hat sich eingebürgert, URLs in Kleinbuchstaben zu schreiben.

2. URLs mit Filterungsparametern, die indiziert oder verlinkt werden

Ein typisches Problem, das Sie auf vielen Websites finden, sind Filterparameter in der URL als Ergebnis einer Filterfunktion, die eindeutige URLs für jede Abfrage erstellt. Das ist ein heikles Problem, weil wir die Benutzerfreundlichkeit nicht beeinträchtigen wollen, aber es kann zu einem Chaos werden, wenn Sie viele Besucher oder Filter haben.

Hier ein Beispiel aus dem Crawl, den wir zuvor durchgeführt haben:

Beispiel Crawl-Daten

Eine einfache Lösung für dieses Problem besteht darin, ein kanonisches Tag zu setzen, das auf die ursprüngliche Version der Seite verweist. Das hilft der Autorität und den Suchmaschinen bei der Entscheidung, welche Version indiziert werden soll.

Wenn Sie außerdem verhindern wollen, dass diese Variationen gecrawlt werden (denn was bringt das schon), können Sie die robot.txt Ihrer Website verwenden, um Crawler daran zu hindern, bestimmte Parameter zu crawlen.

Wir könnten zum Beispiel den folgenden Ausschnitt in unsere robot.txt-Datei einfügen, um Crawlern den Zugriff auf unsere Anmeldeseiten zu verwehren:

Benutzer-Agent: *Disallow: /*?plan=

Bitte beachten Sie, dass die Datei robot.txt den Crawlern vorschreibt, wie sie Ihre Website zu behandeln haben, so dass ein Fehler hier schwerwiegende Auswirkungen auf Ihre Website haben kann. Ohne ein klares Verständnis der Funktionsweise und einen Aktionsplan ist es besser, sich von ihr fernzuhalten.

Hier ist eine großartige Ressource von Cloud Flare über die Verwendung der robot.txt-Datei. Lesen Sie es, bevor Sie eine Idee ausprobieren.

Das heißt, der beste Weg, dieses Problem zu verhindern und zu lösen, ist der Aufbau einer facettierten Navigation, die nicht ätzend ist - Moz' Worte, nicht unsere, lol.

3. Komplexe Taxonomien schaffen Redundanzen

Die Taxonomie einer Website bezieht sich auf die verschiedenen Systeme, die zur Organisation des Inhalts verwendet werden. Zur Verdeutlichung: Wenn wir mit WordPress arbeiten, werden wir zwei Haupttaxonomien feststellen: Kategorieseiten und Tags.

Ein einziger Artikel kann mehreren Kategorien und Tags hinzugefügt werden, und wenn Sie das auf Hunderte von Seiten ausdehnen, kann es passieren, dass viele Tags und Kategorien immer wieder denselben Inhalt anzeigen.

Diese Redundanzen sind eine große Quelle für doppelte Inhalte, und wenn diese Taxonomien sehr unterschiedlich sind, bieten sie keinen Wert für die Benutzererfahrung, was sie zu einer doppelten Verschwendung macht.

Die beste Lösung wäre, die Architektur Ihrer Website zu straffen und dafür zu sorgen, dass die Inhalte einer klar definierten Kategorie zugeordnet werden. Wenn ein Beitrag in drei oder mehr Kategorien angezeigt wird, ist Ihre Seite vielleicht zu breit gefächert, und es wäre besser, sie in kleinere Teile aufzugliedern, die dann für einzelne Themen ranken können.

Wir wissen jedoch, dass das nicht immer möglich ist. Wählen Sie die Hauptkategorie für die Seite und machen Sie diese zur kanonischen Version für diese Szenarien.

4. Lokalisierung und Hreflang

Wenn wir uns an Googles Definition von doppeltem Inhalt erinnern, wissen wir, dass unsere englische Website und unsere spanische Website nicht miteinander kollidieren werden. Das Problem beginnt, wenn wir auf verschiedene Regionen abzielen, die dieselbe Sprache sprechen, und dabei denselben Text oder nur ein paar kulturbedingte Änderungen verwenden.

In diesen Fällen verwendet Google den hreflang-Tag, um zu verstehen, wie diese Versionen behandelt werden sollen. Um doppelte Inhalte zu vermeiden, verwenden Sie diese Konvention im Head-Tag Ihrer Website:

<link rel="alternate" href="http://www.example.com" hreflang="en-us" />
<link rel="alternate" href="http://www.example.com/ireland" hreflang="en-ie" />
<link rel="alternate" href="http://www.example.com/uk" hreflang="en-gb" />

Beispiel aus SEO für mehrsprachige Websites: hreflang tag guide

5. Verteilung von Inhalten

Manchmal möchten wir, dass unsere Inhalte durch Syndizierung, d. h. Wiederveröffentlichung auf anderen Plattformen oder Websites, mehr Aufrufe erhalten. Unser Artikel kann für das Publikum eines anderen nützlich sein, und wir können die Bekanntheit nutzen, um die Reichweite zu erhöhen. Wenn dies jedoch unsachgemäß geschieht, kann die zweite Version des Artikels bei Google ranken, während unsere (die ursprüngliche) im Dunkeln bleibt.

Um dies zu vermeiden, fügen Sie ein kanonisches Tag auf Ihrer Seite ein, um Google mitzuteilen, dass dies die Originalversion des Artikels ist, und bitten Sie Ihren Verbündeten, dasselbe zu tun. Wenn beide Seiten auf das Original verweisen, weiß Google, welche Seite indiziert und bewertet werden soll.

6. Allgemeine Produktseiten

Produktseiten sind eine große Quelle für doppelte Inhalte. E-Commerce-Websites können Hunderte oder mehr Produkte haben, und leider sind sie nicht immer gut optimiert.

Wir haben nämlich häufig festgestellt, dass die gleichen Beschreibungen wiederholt verwendet werden - insbesondere die Beschreibung des Herstellers - was zu unnötigem Wettbewerb führt.

Um sich von der Masse abzuheben, sollten Sie sich darauf konzentrieren, einzigartige Beschreibungen und Produktseiten für Ihre Produkte zu schreiben. Gehen Sie einen Schritt weiter und schreiben Sie über die Kundenerfahrung, wie sich die Verwendung des Produkts anfühlt, und vielleicht einige Anwendungsfälle.

Wenn Sie einzigartige Texte für Ihre Produktseiten verfassen, heben Sie sich in den Augen von Google und Ihren potenziellen Kunden von der Konkurrenz ab - ein doppelter Gewinn.

Sie wissen nicht, wo Sie anfangen sollen? Hier finden Sie eine einfach zu befolgende Strategie, mit der Sie Ihre Produktseiten für Suchmaschinen optimieren können. Sie ist vollgepackt mit praktischen Tipps, sodass Sie alles sofort anwenden können.

7. Landing Page A/B-Tests

Bei der Durchführung einer Werbekampagne ist es wichtig, A/B-Tests zur Optimierung durchzuführen. Diese Testversionen der Landing Pages sind nicht von der Website aus verlinkt, da sie nur über eine Anzeige erreichbar sein sollten.

Dennoch könnten Google und andere Suchmaschinen diese Seiten finden und versuchen, sie zu indizieren und sie als doppelten Inhalt zu kennzeichnen - außerdem kann es passieren, dass eine dieser Seiten indiziert wird und möglicherweise die Daten ruiniert. Das Gleiche gilt für A/B-Versionen einer Live-URL.

Für diese Seiten ist es am besten, einen noindex-Tag hinzuzufügen, um Suchmaschinen anzuweisen, sie zu ignorieren. Schließlich macht es keinen Sinn, sie indizieren zu lassen und damit ein technisches Problem ohne Grund zu riskieren.

Vermeidung von doppelten Inhalten als Teil des Inhaltsprozesses

Bis jetzt haben wir besprochen, wie man mit Problemen mit doppelten Inhalten umgeht. Es macht jedoch keinen Sinn, eine vollständige Prüfung und technische Optimierung durchzuführen, ohne eine Strategie zu entwickeln, um dieses Problem in Zukunft ganz zu vermeiden.

Es gibt verschiedene Möglichkeiten, um doppelte Inhalte zu vermeiden, indem Sie bestimmte Regeln und Parameter festlegen:

  1. Führen Sie für jede neue Seite und/oder jeden neuen Artikel einen Copyscape-Check durch. Manchmal klingen Seiten zum gleichen Thema ähnlich, aber es sollte immer einige große Unterschiede geben.
  2. Stellen Sie Ihren Autoren die notwendigen Ressourcen zur Verfügung, damit sie einzigartige, originelle Inhalte erstellen können.
  3. Seien Sie kreativer bei der Gestaltung von Produktseiten und vermeiden Sie die Verwendung der Standardbeschreibung.
  4. Erstellen Sie eine Regel für den Umgang mit URLs und stellen Sie sicher, dass alle an Veröffentlichungen Beteiligten diese Regel kennen und befolgen.
  5. Erstellen und optimieren Sie die Taxonomien Ihrer Website und die Art und Weise, wie Ihre Webmaster sie handhaben.
  6. Wenn Sie Ihre Seiten für andere Länder mit derselben Sprache lokalisieren, achten Sie darauf, dass Sie die erforderlichen Tags vor der Veröffentlichung hinzufügen - wenn möglich, machen Sie eine Checkliste daraus.

Wenn Sie diese Schritte befolgen, dauert es nur ein paar Minuten, aber Sie ersparen sich Umsatzeinbußen und zig Stunden zur Behebung von Problemen.