Was ist der Canonical Tag?
Der Canonical Tag wird eingesetzt, um Duplicate Content auf einer Webseite zu eliminieren. Duplicate Content liegt dann vor, wenn auf unterschiedlichen URLs einer Webseite derselbe Inhalt angezeigt wird. Das kann schnell unbeabsichtigt passieren, beispielsweise, wenn ein Seitenbetreiber einen Blogartikel veröffentlicht und diesen gleichzeitig auch als PDF-Download zur Verfügung stellt. Da sowohl der Blogartikel als auch das PDF von Google gecrawlt werden, steht der Suchmaschinenriese vor dem Problem, dass er zwei Mal denselben Text sieht und sich nun nicht entscheiden kann, welche der beiden Seiten relevanter für die Google Suchergebnisse ist. Folglich kann das zu folgenden Problemen führen:
- ◾ Die “Rankingkraft” wird auf beide Seiten aufgeteilt, sodass keine der beiden eine wirklich gute Platzierung erreichen kann.
- ◾ Google entscheidet sich selbst für eine Seite, wodurch die andere Seite aus dem Suchmaschinenindex ausgeschlossen wird. Dabei kann es natürlich passieren, dass Google sich für die – aus Sicht des Seitenbetreibers – “falsche” Seite entscheidet. Es kann also sein, dass dann das PDF in der Suchergebnisliste erscheint, obwohl der Seitenbetreiber eigentlich das Ranking für den Blogartikel verbessern wollte.
Mithilfe des Canonical Tags können Seitenbetreiber Google also mitteilen, bei welcher Seite es sich um die “Originalversion” handelt. Die Originalversion wird dann in den Suchergebnissen bevorzugt behandelt, während die Kopien in Hinblick auf Duplicate Content ignoriert werden.
Das sagt Google selbst zum Canonical Tag:
Bedeutung des Canonical Tags für SEO
Der Canonical Tag ist ein wichtiges Werkzeug im Rahmen der sogenannten Onpage Suchmaschinenoptimierung. Durch die Eliminierung von Duplicate Content wird so verhindert, dass wichtige Seiten einer Webseite hinsichtlich des Rankings Schaden nehmen. Zudem werden Backlinks und andere wichtige User-Signale, die eine Kopie der Seite erhält, durch den Canonical Tag automatisch auf das Original übertragen.
Hintergrund zum Canonical Tag
Das “rel=canonical” Attribut wurde 2009 von Google eingeführt und wird auch von Microsoft und Yahoo unterstützt. Zum einen hilft es Webmastern dabei, Duplicate Content zu vermeiden, zum anderen profitieren aber auch Google und andere Suchmaschinen vom Canonical Tag. Denn durch das Tag wird vermieden, dass unnötige Seiten gecrawlt werden, was natürlich auch den Suchmaschinenbots Crawl Budget einspart, welches stattdessen für andere relevante Inhalte eingesetzt werden kann.
Einbindung des Canonical Tags
Der Canonical Tag wird verwendet, um die Originalseite für Google zu kennzeichnen. Die Ursprungsseite wird auch als kanonische Seite oder kanonische URL bezeichnet. Dementsprechend muss der Canonical Tag auf den Kopien (!) der Ursprungsseite eingebunden werden und einen Link zur Originalseite enthalten.
Landet nun ein Crawler auf einer Kopie mit dem Canonical Tag, dann weiß er, dass die im Canonical Tag verlinkte Seite die Originalseite ist. Er ignoriert also die Kopie und folgt stattdessen dem Link zur kanonischen URL.
Der Canonical Tag wird stets im Kopfbereich (Head) der kopierten Seite eingebunden, also zwischen dem <head> und </head> Bereich. In der Praxis sieht das dann so aus:
<link rel=“canonical“ href=“https://ihredomain.de/originalseite/“ />
Was, wenn ein PDF-Dokument die Standardressource ist?
Doppelte Inhalte können auch entstehen, wenn beispielsweise die fiktive Person Thorsten Müller in einem Blog auf seiner Website ein Tutorial veröffentlicht, zu welchem er eine PDF im selben Wortlaut als Download zur Verfügung stellt. Möchte er, dass die PDF von Google als relevanter angesehen wird, müsste er auf der „kopierten“ Blogartikelseite für ein PDF als Standardressource folgenden Befehl im Kopfbereich einbinden:
Link: <https://thorstenmueller.de/tutorial.pdf>; rel=”canonical”
Anwendungsgebiete
Der Canonical Tag wird immer dann eingesetzt, wenn Inhalte mehrfach vorhanden sind. Dies muss nicht immer bewusst passieren. Oft entsteht Duplicate Content auch einfach systembedingt.
1. Startseite ist über verschiedene URLs erreichbar
Es kann passieren, dass die Startseite über mehrere URLs erreichbar ist. Z.B.:
◾ www.domain.de
◾ domain.de
◾ www.domain.de/index.html
In diesem Fall sollte man zunächst versuchen, mittels einer 301 Weiterleitung auf die Hauptversion der Startseite zu verweisen. Sollte dies technisch nicht möglich sein, kann man den Canonical Tag verwenden, um die bevorzugte Version festzulegen.
2. Seite ist über HTTP und HTTPS erreichbar
Möchte man seine Seite auf HTTPS umstellen, kann es ebenfalls passieren, dass nach der Umstellung Inhalte sowohl über HTTP als auch über HTTPS erreichbar sind. Auch hier sollte man zunächst eine 301 Weiterleitung auf die neue Zieldomain einrichten. Erst, wenn dies technisch nicht möglich ist, kann man mittels des Canonical Tags die Originalseite kennzeichnen.
3. Gleiche Inhalte sind in verschiedenen Formaten verfügbar
Manchmal möchte man seine Inhalte in verschiedenen Formaten anbieten. Eine Anleitung z.B. sowohl als PDF, als auch als Druckversion. Mittels des Canonical Tags kann man Google mitteilen, welche Version die bevorzugte ist, um ein schlechteres Ranking beider Dokumente zu vermeiden.
4. Veröffentlichung der Inhalte auf anderen Seiten
Wenn die eigenen Inhalte auch auf anderen Seiten veröffentlicht werden sollen, beispielsweise in Form eines Gastbeitrags oder einer Pressmitteilung, kann mittels sogenannten Cross-Domain-Canonicals ebenfalls die Originalseite ausgezeichnet werden. Hierfür muss auf der externen Seite einfach ein Canonical Tag zur Originalressource auf der eigenen Website gesetzt werden.
Das Gute: alle positiven User-Signale, die über die externe Seite erfolgen, werden durch den Canonical Tag ebenfalls auf den Ursprungsartikel übertragen.
5. Dynamische URLs
Oft ensteht in Onlineshops Duplicate Content, wenn es von einem Produkt mehrere Varianten z. B. verschiedene Größen oder Farben gibt. Die Produktbeschreibung ist dann immer gleich bis auf die Angabe der unterscheidenden Merkmale wie eben die Farbe oder die Größe. Aber auch aufgrund eines Filters oder der internen (Produkt-) Suche werden Parameter mit an die URL angehängt. Dann ist die Seite unter der ursprünglichen URL erreichbar und zusätzlich über eine weitere mit Session-IDs oder anderen Parametern.
6. Pagination
Auch paginierte Seiten (also Seiten mit Seitennummerierung, bspw. bei Blogbeiträgen oder Produktseiten in Onlineshops) sind oftmals von Duplicate Content betroffen. Hierbei handelt es sich jedoch um einen Sonderfall, bei dem der Canonical Tag keinen Sinn macht. Denn genau genommen sind die Inhalte der einzelnen Seiten unterschiedlich, nur die URL ist dieselbe. Verwendet man hier den Canonical Tag, wird die Indexierung der Seiten verhindert.
Stattdessen reicht hier die Kennzeichnung der einzelnen Seiten mit den Attributen rel=“next“ und rel=“prev“, um vorherige und nachfolgende Seiten anzugeben.
Beispiel für eine Pagination:
Häufige Fehler bei der Verwendung von Canonical Tags
Bevor das Canonical Tag verwendet wird, sollte zunächst sichergestellt sein, dass tatsächlich identische oder annähernd ähnliche Inhalte vorliegen. Mithilfe des kostenlosen Online Tools Siteliner lässt sich beispielsweise überprüfen, an welchen Stellen Duplicate Content vorliegt.
Steht eine Webseite in mehreren Sprachen zur Verfügung, zählt dies nicht als Duplicate Content. Google erkennt eine Übersetzung, auch wenn die verschiedenen Sprachversionen inhaltlich dasselbe aussagen. Hierzu auch ein Statement von Google Mitarbeiter Matt Cutts persönlich:
Folgende Fehler sollten beim Einsatz des Canonical Tags außerdem vermieden werden:
- ◾ Die durch den Canonical Tag ausgezeichnete URL muss natürlich erreichbar sein und darf keine 404 Fehlerseite aulösen. Das kann schnell passieren, wenn ein „www.“ vergessen wird oder die angesteuerte Website eine geänderte URL aufweist.
- ◾ Die URL muss die exakte Bezeichnung haben; auch ein zusätzlicher oder fehlender Slash (Schrägstrich) oder „/index.php“ am Ende kann einen falschen Canonical-Tag verursachen.
- ◾ Pro Seite darf nur ein einziger Canonical Tag verwendet werden. Befinden sich mehrere Canonical Tags auf einer Seite, werden alle einfach ignoriert.
- ◾ Der Canonical Tag muss stets im Kopfbereich einer Website erfolgen. Steht er im „Body“, wird er ignoriert.
- ◾ Es sollten immer absolute URLs (mit http:// oder https://, also http://ihredomain.de) verlinkt werden. Der Canonical Tag akzeptiert zwar auch relative URLs (ihredomain.de), allerdings wird die verlinkte Seite dann mit http://ihredomain.de/ihredomain.de/ verlinkt.
- ◾ Sowohl die Originalseite als auch die Kopie mit dem Canonical Tag dürfen kein „noindex“, „nofollow“ oder „disallow“ Tag aufweisen.
Canonical Tag prüfen mit einem Canonical Tag Checker
Mithilfe des kostenlosen Online-Tools “SEO Review Tools” können Sie überprüfen, ob Sie die Canonical Tags korrekt eingebunden haben. Tragen Sie hierfür einfach alle URLs, auf welchen Sie das Tag eingebunden haben, untereinander in das Textfeld ein, um Ihr Ergebnis zu erhalten.
Canonical Tag in WordPress einfügen
WordPress Nutzer benötigen ein Plugin, um ein Canonical Tag zu verwenden. Eines der beliebtesten und kostenlosen SEO Plugins ist Yoast SEO. Nach der Installation und Aktivierung des Plugins, befinden sich nun auf jeder Seite im Backend die Einstellungsmöglichkeiten für die jeweilige Seite. Klickt man hier auf das Zahnradsymbol, hat man die Möglichkeit, die kanonische URL einzufügen:
Wie hilfreich war dieser Beitrag?
Klicke auf die Sterne um zu bewerten!
Durchschnittliche Bewertung / 5. Anzahl Bewertungen:
Bisher keine Bewertungen! Sei der Erste, der diesen Beitrag bewertet.
Es tut uns leid, dass der Beitrag für dich nicht hilfreich war!
Lasse uns diesen Beitrag verbessern!
Wie können wir diesen Beitrag verbessern?