La etiqueta canonical se utiliza principalmente para solucionar problemas de contenido duplicado (te recomiendo que si no estás muy familiarizado con esto del contenido duplicado leas antes ‘contenido duplicado ¿Por qué es un problema?’).
En principio la manera ideal de resolver los problemas con contenido duplicado es a través de redirecciones 301 y no permitiendo el acceso a algunos contenidos con el archivo robots.txt, esta manera resulta más aconsejable que el uso de la etiqueta canonical por:
– La estructura de URLs resulta más limpia. De diferentes URLs, al final conseguimos una.
– Los buscadores actualizan la indexación de estas páginas (o desindexación de las duplicadas) de manera más rápida que con el uso de la etiqueta canonical.
Ahora bien, eso es el caso ideal… muchas veces existen limitaciones ya sea en el manejo del servidor o en la dificultad de implementar una serie de redirecciones de 301.
Veamos un ejemplo real, recientemente me encontré con un grupo de páginas web que participaban en una serie de programas de afiliación, además de tener campañas de banners y PPC. Para detectar el origen de esas visitas y poder asignar de maner correcta las conversiones se hacía uso de diferentes parámetros.
Así pues tras estudiar los datos de Google Webmaster tools me encontré con una cantidad de contenido duplicado dentro de estos sitios web inesperado;
www.pagina.com/?lang=ES&id_afiliado=XXXX&campaign=
www.pagina.com/?lang=ES&id_afiliado=YYYY&campaign=
www.pagina.com/?lang=ES&id_afiliado=&campaign=ZZZZZ
Y así hasta más de 50 URLs diferentes.
Así pues Google estaba indexando como páginas diferentes, páginas que ofrecían el mismo contenido.
El pensamiento inicial es cambiar el sistema de ‘tracking’ y hacerlo más transparente al usuario (esconder las variables en una sesión por ejemplo). Pero en este caso un sistema crítico para el negocio de una empresa y que se venía implementando en muchísimos sitios resultaba demasiado arriesgado realizar estos cambios.
En casos donde la implementación de redirecciones 301 no es posible; ya sea por fala de control sobre el servidor, o excesiva complejidad en los cambios, la etiqueta canonical se muestra como uno de los mejores inventos para un SEO en los últimos tiempos, pues somos capaces de unificar todas esas páginas en una sóla añadiendo una simple línea de HTML.
Para utilizar la etiqueta canonical hemos primero de elegir que página queremos que sea la que vean los buscadores, siguiendo con el ejemplo de las URLs citadas anteriormente, tenemos que seleccionar la URL desprovista de parámetros que no influyan en el contenido, es decir todos los parámetros de tracking que no influyen en la visualización se quedarían fuera y tendríamos una URL tan simple como esta:
www.mipagina.com/?lang=ES
Una vez tenemos esta página añadimos esta URL en el atributo href de la etiqueta canonical, quedando algo así:
<link rel=»canonical» href=»www.mipagina.com/?lang=ES»>
De esta manera le estamos diciendo a los buscadores que sea cual sea la URL que están visitando, le corresponde la URL que le hemos especificado en la etiqueta canonical.
Tras la implementación de la etiqueta canonical estos son algunos de los resultados obtenidos:
– Eliminación de todo el contenido duplicado. Google Webmaster tools ya no muestra páginas con contenido duplicado.
– Google indexa exclusivamente la página especificada en el canonical.
– A pesar de la cantidad de URLs indicadas como contenido duplicado y enlaces con los parámetros (miles de ellos) Google no ha tenido problemas para discernir la URL correcta.
– El tiempo que ha llevado a cabo Google en ‘reordenar’ todo ha sido sobre un mes.
Desventajas:
– La única desventaja es que la etiqueta canonical no evita los problemas que para un usuario generan las URLs con muchos parámetros.
– El reconocimiento de la nueva estructura de URLs, lleva más tiempo que con otro tipo de técnicas, como la redirección 301.
Un post muy didáctico. Gracias por compartir la información sobre el comportamiento de Google tras aplicar la meta canonical. Es bueno saber el tiempo que tarda Google en reordenar su índice. Saludos.
muy útil Estaba buscando como hacerlo. Es ideal si no puedes utilizar los 301.
[…] debiera que te piden hacer una trabajo SEO y no te dan acceso al código, no puedes añadir ni una etiqueta canonical. Yo intento explicarla al cliente la siguiente analogía “¡es como si le pides a un albañil […]
[…] de eliminar muchos de los problemas originados por el contenido duplicado, aprende a utilizar la etiqueta canonical. […]
[…] el elemento de enlace rel=”canonical”. José Linares nos explica de una de sus post cómo implementar correctamente este parámetro. Así que os invitamos a todos detectar con la herramienta Google webmaster tools las posibles […]
yo sigo sin entender todos tags posicionados de mi pagina irían a una única pagina???
Jose, Muchas gracias por explicar tan bien este tema de los canonicals que lo tenia muy disperso
Muchas gracias por la informacion, una unica pregunta, ¿la etiqueta canonical tambien ha de estar presente en la pagina principal? osea, a la que apunto el resto.
Excelente, gracias Jose.
Cómo aplicaría esto en el caso de las páginas con versiones móviles?
[…] para el posicionamiento. Sin embargo, esto se soluciona fácilmente con la implementación de la etiqueta canónica, que es la que indica a los robots de Google quien es el autor original de la […]
[…] uso del canonical tag corrige problemas de contenido duplicado dentro de tu sitio y mejora la indexación en […]
Me fueron bastanta utiles sobre todo con los ejemplos que me han ayudado bastante con sitios web de varios clientes que tengo.