Saltar al contenido

Contenido duplicado ¿Por qué es un problema?

contenido-duplicado

El contenido duplicado en buscadores se da cuando dos URLs diferentes muestran el mismo contenido (o un textso muy parecido). ¿Y esto es un problema? Pues si, digamos que el contenido duplicado impide que tu web funcione a pleno rendimiento en los buscadores; todo funciona, se consiguen buenos rankings pero podríamos funcionar mucho mejor. Además es a día de hoy uno de los principales motivos de penalización.

Podríamos hacer una clasificación:

– Contenido duplicado con otro sitio web externo.
– Contenido duplicado en mi propio sitio web.

Contenido duplicado con otro sitio web.

El contenido de tu sitio web es muy similar al de otros sitios web. Obviamente o eres el plagiador o eres el plagiado y mejor estar en el lado de ser plagiado (aunque a veces pensemos lo contrario).

Los buscadores ante dos páginas iguales, han a escoger una como la fuente original y esta fuente original será la que se muestre en los resultados de búsqueda, la que tendrá el crédito de los buscadores. Entre los factores más importantes para determinar la fuente original es:

– Popularidad del sitio web.

– Fecha de publicación.

(Podeís leer más en este artículo sobre como detectan los buscadores contenidos duplicados)

Por tanto, si tu contenido es el original tienes muchos números para que sea el que los buscadores tomen como fuente original. Si por el contrario algún sitio popular te copia y debido a su popularidad aparece por encima tuyo… haz un poco de ruido, algo de polémica te vendrá bien (y te dará unas cuantas menciones) y que un sitio popular te copie te dará un crédito importante. Generalmente, los sitios web que toman contenido suelen indicar la fuente y darte valiosos enlaces. Además si eres listo e incluyes enlaces en tus textos el plagiador te puede estar enviando interesantes enlaces (el enemigo será tu amigo).

Si tienes un alma plagiadora incontrolable, siempre puedes poner fragmentos. A veces funciona, pero estás entrando en arena movedizas y en cualquier día una actualización de algoritmos te puede dejar fuera de los rankings.

Si eres muy celoso de tu contenido y lo tienes protegido por copyright… siempre puedes ir a las malas y recurrir a acciones legales, yo no lo recomiendo.

Contenido duplicado en mi propio sitio web.

Este es el que debería preocuparnos principalmente.

Diferentes partes de tu sitio web ofrecen el mismo contenido y esto es un problema. Al ser nuestro sitio web, tenemos pleno control para solucionarlo.

La mayoría de nosotros creemos que no tenemos contenido duplicado… pero mejor que sean los buscadores los que juzguen eso por nosotros. Una sencilla manera de hacerlo es utilizando Google Webmaster tools -> diagnósticos->sugerencias de html y ver si tenemos etiquetas title duplicadas y analizando las URLs que se nos muestra igual encontramos algunas cosas inesperadas; como por ejemplo:

1- Página con un idioma por defecto y pasado por parámetro (generalmente este enlace se realiza desde el menú de cambio de idioma) mostrando el mismo title.

www.tupagina.com

www.tupagina.com?idioma=Espanol

En el caso de que el lenguage por defecto sea español, nos encontramos con dos URLs que generan el mismo contenido y por tanto duplicado. Los buscadores ‘indexarán’, es decir, tendrán almacenadas dos páginas (www.mipagina.com y www.mipagina.com?lang=ES) y con el mismo contenido.

2- Artículo, noticia, producto por defecto y pasado por parámetro mostrando la misma etiqueta title.

Tu sección de productos siempre muestra un producto por defecto (www.mipagina.com/productos.php), pero a su misma vez ese producto puede ser pasado por parámetro (www.mipagina.com/productos.php?id_producto=1). Estamos en el mismo caso, dos URLs diferentes y un mismo contenido.

3- Páginas con parámetros opcionales en la URL mostrando el mismo title.

En muchos casos algunos parámetros son añadidos a la URL, parámetros que tienen un propósito interno pero que no influyen en la visualización de nuestra página, un claro ejemplo son los parámetros para controlar la fuente de la visita por ejemplo

www.mipagina.com?id_afiliado=XX

www.mipagina.com?id_campaign=XX

www.mipagina.com

Volvemos a tener varias URLs diferentes y un mismo contenido.

4- Páginas enlazadas con diferentes orden de los parámetros.

Estas dos URLS, mostrarían la misma información, pero generarían problemas de contenido duplicado:

www.pagina.com?id_cat=XX&id_producto=XX

www.pagina.com?id_producto=XX&id_cat=XX

Este puede ser un error poco común, pero a veces una programación descuidada o cambios en el equipo puede hacer que cosas de este tipo pasen.

Pero ¿Cuál es problema? Es cierto que contenido duplicado se pueden obtener buenos rankings, el contenido duplicado no penaliza (al contrario de lo que muchos creen, no existe una penalización de -50 por contenido duplicado). Los buscadores siempre eligen una de las urls para mostrar y como el contenido duplicado es de mi sitio web, al final el usuario acabará llegando a mi sitio web ¿no?

Cuando existe contenido duplicado los buscadores deciden que página mostrar, eligen una página y desprecian las otras. Por ello todos los enlaces (tanto internos, como externos) que tus páginas ‘despreciadas’ tendrán un valor global para tu sitio… pero no estarán ayudando a esa sección o producto concreto, sino al contrario le están quitando un enlace que le corresponde. Toda persona que esté familiarizada con el SEO sabe cuan valioso es un enlace a tu página… imagínate el problemón si estabas mostrando a un usuario que te iba a enlazar una de esas páginas ‘despreciadas’ y con ello estarías tirando a la basura parte del poder de ese enlace.

Admás las arañas de los buscadores (y Googlebot como ejemplo más importante) son como niños de 3 años, hay que explicarles las cosas muy simples y claritas… si tienen muchas páginas con el mismo contenido, no van a tener claro cual elegir, lo que podría perjudicarnos y lo que sería peor que tomara una URL que no nos interesa y ya se sabe lo difícil que es cambiar los malos hábitos de los niños.

Todos conocemos la frase ‘Divide y vencerás’, pues aquí se trata de no ser vencido y que nuestras páginas con mismo contenido estén bajo la misma URL.

Si quieres una manera fácil de eliminar muchos de los problemas originados por el contenido duplicado, aprende a utilizar la etiqueta canonical.

7 comentarios

  1. Muy buena recopilación, Jose. Si me lo permites, la complemento con otros casos con que nos encontramos habitualmente: id de sesión en URL (muy habitual en sitios de comercio electrónico en donde añaden la id de sesión desde la primera página vista, en lugar de cuando se añade el primer producto al carrito) y versiones imprimibles de una página, que suelen coincidir en el 95% del contenido aunque con una URL distinta. Un abrazo.

  2. Gracias Fernando;

    Totalmente cierto lo que comentas, sin duda contribuyen a completar los casos mencionados.

    Saludos.

  3. jcjurado jcjurado

    El contenido duplicado desde otro sitio web es un verdadero problema si no se sabe gestionar. Dado que los reconocimientos de autoría a posteriori no suelen dar sus frutos. Creo que la solución que dás, convertir el enemigo en amigo, es quizás la mejor opción.

    De hecho, en oídococina! internet deconstruída lo hemos sufrido en numerosas ocasiones. Y en un reciente post proponíamos dicha solución, pues no requiere conocimientos avanzados.

    Con tu permiso, dejo el enlace:

    http://oídococina.com/2009/08/29/la-visita-de-un-scrapper/

  4. Sarai Suárez Sarai Suárez

    Hola Jose,

    Enhorabuena por tu blog, soy una consumidora habitual de tus contenidos, Una preguntilla tan sólo, si utilizas xiti para la analítica web , sabes como puedo acceder al reporte de contenidos duplicados de mi web?

    Otro apunte, me encanta la selección que haces de fotos pero hecho en falta el pie de foto con la autora: Diane Arbus, 🙂

  5. […] entre otras. Además ordenando los resultados por la columna ‘Title’ podreis detectar contenidos duplicados… vamos una maravilla de programa. Si conoceis de otras interesantes herramientas para […]

  6. What an interesting site! I am grateful

  7. Lucas Agudelo Lucas Agudelo

    Hola chicos! creo que entendí un poco. Me gustaría hacer una pregunta: tengo un dominio con fordward Masking a mi wordpress.com.(el gratis. y estaba posicionando las imagenes muy bien… pero un día mande un enlace desde .wordpress.com y las imágenes bajaron.
    Es posible que goolge pensara que era contenido duplicado porque encontró el .com y el wordpress.com?
    Yo además le pongo a todas la imagenes las palabras claves todas las veces… eso puede ser también el problema?

    mil y mil gracais

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *