El proceso de convertir datos que pueden representarse de varias maneras a un formato considerado estándar en la industria se denomina canonización. Una conversión de este tipo garantiza que los datos cumplan con los requisitos canónicos. Esto compara las distintas representaciones para garantizar la equivalencia, contar el número de estructuras de datos únicas, aplicar un orden de clasificación coherente y aumentar el rendimiento del método, eliminando la necesidad de cálculos repetitivos.
El proceso de generar datos canónicos a partir de información no canónica se denomina canonización y se emplea en una amplia variedad de aplicaciones informáticas y de Internet. Por ejemplo, la forma canónica de los datos se utiliza ampliamente en la optimización de motores de búsqueda (SEO), servidores web, XML y Unicode.
¿Por qué es importante la canonización?
La canonización de URL es una técnica utilizada en la optimización para motores de búsqueda (SEO) para contenido web con más de una URL potencial. Debido a esto, existe la posibilidad de que el motor de búsqueda no sepa qué URL debe mostrarse, lo que puede generar resultados inconsistentes. Al referirse a las páginas de inicio, la canonización selecciona una URL como la versión definitiva entre múltiples alternativas. Incluso si algunas URL parecen iguales, los distintos servidores web proporcionarán resultados diferentes para cada una. La forma canónica de una URL solo la considera uno de los motores de búsqueda.
La canonización ayuda en la seguridad informática.
La canonización de los nombres de archivo es fundamental para la seguridad informática. Algunos servidores web contienen una regla de seguridad que restringe la ejecución de archivos a un directorio específico. Posteriormente, el archivo solo se ejecuta si la ruta incluye la guía proporcionada previamente en el comando. Si el nombre del archivo es una representación única, se denomina "travesía de directorio".
Se utilizan codificaciones de longitud variable para la gran mayoría de los caracteres del estándar Unicode. Esto exige un análisis minucioso de cada carácter de la cadena, lo que dificulta su validación. Existe el riesgo de que se produzcan defectos de software si la implementación del programa no considera todas las codificaciones de caracteres posibles.
Un documento XML canónico es un documento XML en formato XML canónico. El estándar XML canónico lo define. Al canonizar documentos XML, se eliminan los espacios en blanco dentro de las etiquetas, se ordenan las referencias a espacios de nombres, se eliminan las referencias redundantes y se utilizan ciertas codificaciones de caracteres. Además de convertir las URL relativas en URL absolutas, también se eliminan las declaraciones XML y DOCTYPE que pudieran estar presentes.
¿Cuándo es necesario el uso de URL canónicas?
Para la optimización en motores de búsqueda (SEO), usar una URL o etiqueta canónica puede ser una estrategia práctica para estructurar y mejorar su sitio web (y a sus clientes). Sin embargo, determinar el momento adecuado para canonizar su contenido puede ser difícil. Esto es especialmente cierto si gestiona un sitio web de comercio electrónico en rápida expansión con muchas páginas.
Las páginas creadas con Accelerated Mobile Pages (AMP) y dominios específicos para móviles necesitan sus versiones canónicas. Es fundamental ofrecer contenido adaptado al entorno móvil; sin embargo, si desea crear páginas específicas para móviles en example.com para sus visitantes, deberá informar a Google de que estos sitios son canónicos y no representan contenido duplicado. Visite Seahawk Media para obtener más información sobre la canonización.