Wer Webseiten auf Suchmaschinen indexiert, wird häufig in dessen Berichterstattung mit Fehlermeldungen konfrontiert. Einige davon beziehen sich auf Seiteninhalte, die vermeintlich "doppelt vorhanden" sind, es sich dabei um "Duplikate" handelt. 

Die Meta-Tags

Internetseiten verfügen über einen bestimmten Bereich, der außerhalb des optischen Erscheinungsbildes liegt, und die Webseite beschreibt. Dieser sogenannte Meta-Bereich wurde speziell für Suchmaschinen entwickelt und ermöglicht es, Zusatzangaben in die Seite zu integrieren. Sie sind für den Besucher nicht sichtbar. Diese Zusatzangaben sind im Kopfbereich (Head) der einzelnen Webseite untergebracht und können vielseitige Informationen geben. Eine Seite ohne optischen Inhalt auf der Basis von HTML mit Meta-Angaben, könnte so aussehen:

<html><head>
<title>Webseite von Peter Mustermann</title>
Diese Meta-Angabe gibt den Titel der Webseite vor
<meta name="description" content="Dies ist meine private Webseite">
Diese Meta-Angabe liefert eine Beschreibung der Webseite
<meta name="keywords" content="Peter, Mustermann, privat, Homepage">
Gibt kurze Schlüsselwörter (Keywords) vor, um den Inhalt mit einzelnen Wörtern zu beschreiben
<link href="/https :// www. meinehomepage . com/meininhalt/" rel="canonical"/>
Das Beziehungs-Attribut "rel" (Relationship) klassifiziert den vorstehenden Hyperlink als kanonisch (canonical). Die URL-Angabe im Hyperlink beschreibt dabei den Pfad zur "Orginalseite"
</head><body></body></html>

Innerhalb der Meta-Angaben stellen die Tags (zu dt. "Etikett") eine Organisationseinheit für eine Information dar. Ein kanonischer Tag ist dabei ein HTML-Attributwert, der eine URL als kanonisch für den Seiteninhalt kennzeichnet. Ist eine Seite über mehrere URLs erreichbar, wird die angegebene Internetadresse dabei als Haupt- oder Orginalseite von Suchmaschinen angesehen.
(Die Leerzeichen in den URLs dienen der Übersicht und dürfen in der Praxis nicht bestehen)

Das Problem

Gerade im Zeitalter sog. Web Content Management Systeme (WCMS), sind einzelne Seiten über unterschiedliche URL-Formate erreichbar. Diese WCMS bieten zumeist Einstellungen für suchmaschinenfreundliche URL-Ausgaben und verfügen dazu noch über Adressierungsmöglichkeiten der internen Strukturverwaltung. So kann ein und die selbe Seite unter unterschiedlichen URLs auch für Suchmaschinen erreichbar sein:
(Die Leerzeichen in den URLs dienen der Übersicht und dürfen in der Praxis nicht bestehen)

  1. https :// www. meinehomepage . com/meininhalt
  2. https :// www. meinehomepage . com/index.php/meininhalt
  3. https :// www. meinehomepage . com/?com_content&id=3

Dies hätte die Folge, dass Suhmaschinen alle drei Seiten als unterschiedliche Seitenziele mit übereinstimmenden Inhalt wahrnimmt. Für die Suchmaschine sind hier mindestens 2 Duplikate vorhanden. Um diese falsche Indexaufnahme auszuschließen, kann im Meta-Bereich die URL zur kanonischen Seite angegeben werden. So kann diese kanonische Seite als Indexierungsbestandteil aufgenommen werden.

In der Regel können alle großen Suchmaschinen diese kanonischen Tags auswerten. Sollte für die Webseite ein WCMS eingesetzt werden, sollte man prüfen, ob dieses Verwaltungssystem eine Option anbietet, eine einzelne Seite als kanonisch festzulegen. Einige WCMS (z. B. Wordpress) bieten zudem Erweiterungen (sogenannte "Plugins") an, mit der eine solche Funktion nachträglich installiert und kanonische Seiten verwaltet werden können.