Die Umwandlung von Daten, die auf verschiedene Arten dargestellt werden können, in ein als Industriestandard geltendes Format wird als Kanonisierung bezeichnet. Eine solche Konvertierung gewährleistet, dass die Daten den kanonischen Anforderungen entsprechen. Dabei werden die verschiedenen Darstellungen verglichen, um Äquivalenz sicherzustellen, die Anzahl der eindeutigen Datenstrukturen ermittelt, eine sinnvolle Sortierreihenfolge erzwungen und die Leistung des Verfahrens gesteigert, wodurch wiederholte Berechnungen entfallen.
Die Erzeugung kanonischer Daten aus nicht-kanonischen Informationen wird als Kanonisierung bezeichnet und findet in einer Vielzahl von Internet- und Computeranwendungen Verwendung. Beispielsweise wird die kanonische Datenform umfassend in der Suchmaschinenoptimierung (SEO), bei Webservern sowie in der XML- und Unicode-Branche eingesetzt.
Warum ist die Kanonisierung wichtig?
Die Kanonisierung von URLs ist eine Technik der Suchmaschinenoptimierung (SEO) für Webinhalte mit mehreren möglichen URLs. Dadurch kann es vorkommen, dass die Suchmaschine nicht weiß, welche URL angezeigt werden soll. Dies kann zu inkonsistenten Suchergebnissen führen. Bei Startseiten wählt die Kanonisierung eine URL als endgültige Version aus mehreren Alternativen aus. Selbst wenn URLs identisch erscheinen, liefern verschiedene Webserver unterschiedliche Ergebnisse für jede URL. Die kanonische Form einer URL wird immer nur von einer Suchmaschine berücksichtigt.
Die Kanonisierung trägt zur Computersicherheit bei.
Die Kanonisierung von Dateinamen ist die Grundlage der Computersicherheit. Manche Webserver enthalten Sicherheitsregeln, die die Ausführung von Dateien auf ein bestimmtes Verzeichnis beschränken. Die Datei wird dann nur ausgeführt, wenn der Pfad die zuvor im Befehl angegebene Adresse enthält. Wenn der Dateiname eine eindeutige Darstellung ist, spricht man von Directory Traversal.
Für die überwiegende Mehrheit der Zeichen im Unicode-Standard werden Kodierungen variabler Länge verwendet. Dies erfordert eine sorgfältige Prüfung jedes einzelnen Zeichens in der Zeichenkette und erschwert somit die Validierung. Es besteht die Gefahr von Softwarefehlern, wenn die Programmimplementierung nicht alle möglichen Zeichenkodierungen berücksichtigt.
Ein kanonisches XML-Dokument ist ein XML-Dokument in kanonischer XML-Form. Der kanonische XML-Standard definiert dieses Dokument. Bei der Kanonisierung von XML-Dokumenten werden Leerzeichen innerhalb von Tags entfernt, Namespace-Referenzen sortiert, redundante Referenzen entfernt und bestimmte Zeichenkodierungen verwendet. Zusätzlich zur Umwandlung relativer in absolute URLs werden auch alle vorhandenen XML- und DOCTYPE-Deklarationen entfernt.
Wann ist die Verwendung kanonischer URLs erforderlich?
Für die Suchmaschinenoptimierung (SEO) kann die Verwendung einer kanonischen URL oder eines kanonischen Tags ein praktischer Ansatz sein, um Ihre Website (und damit auch Ihre Kunden) zu strukturieren und zu verbessern. Es kann jedoch schwierig sein, den richtigen Zeitpunkt für die Kanonisierung Ihrer Inhalte zu bestimmen. Dies gilt insbesondere für schnell wachsende E-Commerce-Websites mit vielen Seiten.
Seiten, die mit Accelerated Mobile Pages (AMP) und mobilen Domains erstellt wurden, benötigen ihre kanonischen Versionen. Es ist wichtig, Inhalte bereitzustellen, die für mobile Endgeräte optimiert sind. Wenn Sie jedoch mobile Seiten auf example.com für Ihre Besucher erstellen möchten, müssen Sie Google mitteilen, dass diese Seiten kanonisch sind und keine Duplikate darstellen. Seahawk Media Weitere Informationen zur Kanonisierung