¿Qué es el Contenido Duplicado en SEO y cómo Solucionarlo?

El contenido es un aspecto fundamental del SEO, ya que el posicionamiento orgánico trata de posicionar palabras clave objetivo y estas se encuentran en el contenido.

En este post quiero hablaros de uno de los problemas más comunes de cualquier página web o tienda online de cualquier tipo, el contenido duplicado.Tener un alto grado de contenido de duplicado es un error fundamental de cara al posicionamiento orgánico.

Queremos explicaros ¿Qué es el contenido duplicado? y cuales son las consecuencias de este de cara al SEO además de, por supuesto, que opciones tenemos para solucionarlo.

¿Qué es el Contenido Duplicado?

que es el contenido duplicado en seo

Con contenido duplicado nos referimos de forma general, a cualquier contenido muy parecido o exactamente igual que aparezca en varias landings de un sitio web.

De forma más estricta, para los buscadores, contenido duplicado es aquel que se repite de manera parcial o completamente exacta en una dirección web, es decir, una URL, tanto si es interna como externa.

Este tipo de contenido será perjudicial por un lado para el usuario, ya que no le aportará ningún valor. Como es lógico los visitantes de un sitio web, quieren ver contenido de calidad y diferente en cada sección de tu sitio web, para que les aporte valor y sea diferencial.

A su vez, y más importante es de cara a los motores de búsqueda como Google, el contenido duplicado en cualquier sección o apartado de una URL, es mal visto a ojos de Google y puede penalizar el posicionamiento orgánico de tu sitio web.

Digo más importante, ya que Google cada vez que rastree una URL en específico la ve de manera total, de arriba a abajo podemos decir, de forma que siempre ve todo el contenido de dicha landing, detectando si es igual a parecido al de otras URLs.

En cambio a ojos de los usuarios, puede no ser tan fácilmente detectable este contenido duplicado, ya que muchas veces no vemos el contenido completo de una landing en concreto.

A continuación vamos e explicar de manera específica y más extensa que es el contenido duplicado en SEO.

Contenido duplicado en SEO

Cuando hablamos de contenido de duplicado en SEO, no estamos refiriendo a los motores de búsqueda, en nuestro caso a Google.

En primer lugar decir que cuando estamos hablando de factores SEO a optimizar en nuestro sitio web, el contenido duplicado es uno de los factores que si no tenemos correctos pueden acarrearnos más problemas en nuestro posicionamiento orgánico.

El contenido duplicado en SEO, se produce cuando Google al rastrear o analizar dos o más URLs diferentes las considera como iguales o muy similares.

Esto puede ser desde el texto de las páginas, pasando por diferentes factores técnicos como las etiquetas meta o las imágenes hasta la propia dirección de dominio web.

Si nos fijamos en el soporte de Google, en el siguiente artículo, Google deja claro que el contenido duplicado puede penalizar en un sitio web a no ser que su intención sea claramente manipular los resultados de búsqueda.

De esta forma Google podrá emprender medidas contra el sitio web en mayor a menor medida, dependiendo del grado de contenido duplicado, desde su eliminación completas por los motores de búsqueda hasta la caída de visibilidad en determinadas URLs.

¿Cómo afecta al SEO el contenido duplicado?

Cómo afecta al SEO el contenido duplicado

Ahora que ya sabemos que es exactamente el contenido duplicado de cara al SEO, por el cual Google puede penalizarnos, vamos a entenderlo un poco más, viendo como afecta este tipo de contenido al SEO.

Como sabemos, los robots de Google asignan un tiempo determinado para rastrear un sitio web, y el contenido duplicado hace que estos se retrasen buscando, y en consecuencia tenga menos tiempo para rastrear un sitio web determinado.

Esto puede desembocar en que no se indexen URLs relevantes de tu sitio web, ya que por esta perdida de tiempo no han podido ser detectadas por Google, es decir, problemas de indexación.

A su vez si tenemos diferentes versiones del sitio web que están siendo indexadas como por ejemplo la versiones “https” y “http”, a parte de estar duplicando el contenido, estamos diluyendo la autoridad, que puede llegar por el enlazado externo, Redes Sociales, etc…, del sitio web entre estas dos versiones, haciendo que cada versión tenga menos fuerza y en consecuencia disminuya la visibilidad y el rendimiento de ambas versiones.

Como vemos el contenido duplicado en SEO afecta muy negativamente a nuestro sitio web. Como ya he comentado en el momento que los bots de Google lo detectan puede ser penalizado, por las siguientes razones.

  • Google puede seleccionar o filtrar de forma que este contenido no aparezcan en los resultados de búsqueda o pierdan visibilidad.
  • En relación con el Algoritmo Panda, si la copia se produce de manera sistemática, Google penaliza de manera directa estas URLs.
  • En el caso, más excepcional de denuncias por plagio, un revisor de Google, es decir, una persona que trabaja en Google, puede realizar ciertas comprobaciones y en su caso decidir realizar una penalización manual al sitio web

Causas más relevantes de contenido duplicado

La gran mayoría de las veces el contenido duplicado se produce como consecuencia de una mala configuración del sitio web, estas incidencias son de origen técnico y rara vez son penalizadas por Google, pero si que perjudican a tu posición en los rankings y a la visibilidad de tu sitio web.

A continuación vamos a ver las incidencias técnicas que pueda originar contenido duplicado, además de ver posibles soluciones.

Contenido duplicado por incidencias técnicas

Contenido duplicado por incidencias técnicas

Como he comentado este tipo de incidencias se producen por una mala configuración y estructura del sitio web.

Versiones WWW vs NO-WWW y HTTP vs HTTPS duplicadas

Si estás utilizando el dominio, por ejemplo con WWW y HTTPS, es decir, https://www.midominio.com, está seria la versión “buena” de tu dominio, donde querremos concentrar todo el tráfico de tu sitio web.

Normalmente también están disponibles las versiones NO-WWW y HTTP, de forma que si tu servidor no está correctamente configurado, Google puede indexar estas versiones y en consecuencia se generaría contenido duplicado además de estar diluyendo el tráfico en estas versiones.

Para solucionar este problema se tiene que elegir una versión “buena” de nuestro sitio web, siguiendo el ejemplo, WWW y HTTPS, y por un lado, establecer en la herramienta de websmaster, Google Search Console, que la versión: https://www.midominio.com, es la preferida.

A su vez, se tienen que trabajar los redireccionamientos 301 de las demás versiones a la versión elegida como preferida en el sitio web, de esta forma estaremos focalizando en tráfico en esta versión y no generaremos contenido duplicado.

URLs con: Mayúsculas / minúsculas o con / o sin /

Google distingue las mayúsculas y las minúsculas en las URLs y las diferencia, de forma que, https://www.midominio.com/pagina-a y https://www.midominio.com/pagina-A
Son percibidas como diferentes para Google, pero al crear enlaces se puede cometer un fallo, y Google al reconocerlas como diferentes indexaría ambas versiones lo que causaría contenido duplicado.

Algo parecido sucede con la / final en las URLs, en múltiples ocasiones las URLs son accesibles por ambas versiones, con o sin / al final. Para solucionar esto se tiene que establecer una URLs de forma prioritaria ya seo con / o sin / y establecer redireccionamientos 301 en los casos que sea necesario.

Página accesible por múltiples URLs

Es perfectamente posible que tu sitio web, sea accesible por varias URLs sin tu tener conocimiento de ello, como consecuencia de una mala configuración de tu servidor, a parte de https://www.midominio.com. A continuación se muestran algunos ejemplos:

  • https://www.midominio.es/index,html
  • https://www.midominio.es/index.asp
  • https://www.midominio.es/index.php

La solución a este tipo de inconveniente, pasa por elegir una versión “buena”, cómo preferida, en nuestro caso, siguiendo el ejemplo: https://www.midominio.com, e implementar los redireccionamientos 301 necesarios desde las demás versiones a esta.

URls con parámetros causados por los filtros

En determinados sitios web, sobre todo en cualquier tipo de tienda online, se utilizan filtros. De cara al usuario está bien, ya que le permite segmentar sus búsquedas de productos o servicios utilizando un filtro, como por ejemplo un filtro para un color y tamaño.

Normalmente los sitios web, utilizan parámetros en las URLs para generar esta función de filtrado, es decir, cada vez se genera un filtro por parte del usuario a su vez genera una URLs parametrizada. Si vemos el ejemplo:

  • https://www.midominio.com/camisetas?color=negro
  • https://www.midominio.com/camisetas?color=negro

Estas dos páginas mostrarían todas las camisetas negras y blancas respectivamente en distintas URLs.

Como he comentado, esto está bien para los usuarios, pero paro los motores de búsqueda, Google, puede ocasionar serios problemas. Como vemos se generan infinidad de URLs a partir de los filtros dependiendo de las opciones de filtrado disponibles en el sitio web. Mostrando las URLs exactamente el mismo contenido, ya que lo único que cambia es el color de la camiseta no el contenido de la landing.

De esta forma a partir de los filtros, para Google estamos genrando infinidad de URLs con el contenido duplicado.

Para solucionar este problema, tenemos que evitar que Google, en nuestro caso, detecte y por consiguiente rastree estas URLs. Esto lo conseguiremos ofuscando los enlaces de los filtros, de forma que no pierdan la utilidad para los usuarios, pero no sean detectados por Google.

Mala anidación de las URLs

Una correcta anidación de las URLs del sitio web tiene varios factores positivos de cara al SEO, y entre ellos se encuentra en muchos casos evitar contenido duplicado.

En un sitio web, existen categorías y sub categorías de un nivel inferior, pues bien, normalmente estas categorías y sub categorías se plasman en las URLs. Por ejemplo:

  • https://www.midominio.com/camisetas/manga-larga
  • https://www.midominio.com/camisetas/camisetas/manga-corta

Vemos en estas dos URls que pertenece a las misma categoría (camisetas) y se difereferencian en las subcategorías (manga largo o manga corta), es decir, en la misma URL contiene la categoría superior y la categoría propia de la página en cuestión.

Si nos fijamos en estas dos URLs, nos damos cuenta de que se está repitiendo la palabra “camisetas”, generando duplicidad en estas URLs, que los motores de búsqueda, Google, van a detectar.

Es aquí donde una correcta anidación nos soluciona este problema. Después del dominio principal se tiene que poner las palabras adecuadas que hagan alusión a la página en cuestión y no a las categorías superiores a la que pertenecen. Siguiendo el ejemplo:

  • https://www.midominio.com/manga-larga
  • https://www.midominio.com/manga-corta

De esta forma, no repetimos la palabra “camisetas”, por lo que no se produce esta duplicidad.

URLs originadas por la paginación

La paginación se produce normalmente en tiendas online, o en cualquier tienda cuando cambiamos de página para seguir viendo contenido, en el caso de tiendas online productos o servicios.

El cambiar de página, se genera una nueva URL parametrizada, véase en el siguiente ejemplo:

  • https://www.midominio.com/camisetas/pag/2
  • https://www.midominio.com/camisetas/pag/3

Como vemos estas dos son URLs diferentes que se generan al pasar a las páginas 2 y 3 de la categoría “camisetas”. Estas dos páginas tendrán el mismo contenido, solo cambian los productos, en este caso las camisetas, pero el contenido es el mismo, generando duplicidad en las páginas asociadas a estas URLs generadas por la paginación.

Este problema se puedo solucionar fácilmente, trabajando correctamente las URLs canónicas en las categorías con paginación, estableciendo una URL canónica que Google reconozca como prioritaria de forma que no tenga en cuenta las generadas por la paginación y de esta forma nos evitamos esta duplicidad.

Si quieres aprender más sobre como utulizar la URL canónica, puedes visitar el siguiente enlace. Aquí.

URLs con taxonomías

Las taxonomías se generan como un mecanismo de clasificación para los contenidos que se van publicando en un blog, creando etiquetas y categorías.

Si tienes un blog con por ejemplo, 3 categorías, a las cuales se vinculan 3 etiquetas, véase en el siguiente ejemplo:

  • https://www.midominio.com/categoria-a/etiqueta
  • https://www.midominio.com/ccategoría-b/etiqueta
  • https://www.midominio.com/ccategoría-c/etiqueta

Como vemos cada etiqueta genera una nueva URL y esta etiqueta se puede encontrar en las mismas categorías, generando contenido duplicado, Google detectara estas etiquetas como un enlace y las rastreará.

Para evitarnos esta duplicidad tenemos que evitar que Google detecte y rastree estos enlaces, una buena opción es ofuscar las enlaces a las etiquetas de forma que no pierdan su utilidad para el usuario pero Google no los detecte.

Contenido copiado que origina contenido duplicado

Contenido Copiado que origina contenido duplicado

Con contenido copiado, nos estamos refiriendo a copiar este contenido total parcialmente tanto de páginas internas del propio sitio web como de páginas externas.

Páginas de aterrizaje

La búsqueda de pago o el relleno de formularios requieren dirigir al usuario a una página de aterrizaje que por ejemplo, puede de “gracias” por la acción realizada por parte del usuario.

Las páginas de aterrizaje normalmente son copias de páginas internas ya existentes modificadas para atender a palabras específicas, dado que estas páginas son parcialmente parecidas, pueden generar contenido duplicado una vez son indexadas por los motores de búsqueda, Google.

La solución a esto es muy sencilla, simplemente se tiene que evitar que este tipo de páginas se indexen. Para ello se tiene que implementar la etiqueta Noindex en el head de la página, eliminarla del sitemap.xml y evitar que se rastree cualquier enlace hacia esta página, también podemos restringir su acceso desde el archivo robots.txt.

Contenido copiado de otros sitios web

También puede aparecer contenido duplicado si una web externa copia tu contenido y lo publica en otro lugar, con el aliciente de que si el dominio de esta web externa tiene mayor autoridad que el nuestro, a ojos de Google, él puede ser percibido como el autor real de este contenido.

La solución a este inconveniente, pasa por que otros sitios web te permitan implementar la URL canónica que dirija a tú página, si esto no es posible o no estuviesen dispuesto a permitirlo, puedes enviar una solicitud a Google y emprender las acciones legales pertinentes.

Contenido duplicado en las Etiquetas Meta

Ahora vamos a ver el contenido duplicado en las etiquetas meta título y meta descripción. Estas son las metas que se visualizan como título y descripción en los resultados de búsqueda de nuestras diferentes landings.

Meta Título y Meta Descripción

Es muy común la existencia de meta títulos y meta descripciones duplicados en un sitio web, por ejemplo, por que las páginas o los productos ofertados son muy parecidos.

Estas etiquetas tiene que ser únicas y diferentes entre si, no podemos repetir el mismo meta título o meta descripción en ninguna URL.

Para ello se tiene que crear cada página con esta diferenciación o si ya los tenemos duplicados, se pueden cambiar manualmente.

Conclusiones

En este post os he querido hablar de que es el contenido duplicado enfocandolo hacia sus consecuencias para el SEO.

Explicaros los factores técnicos en el ámbito del SEO que más comúnmente pueden originar contenido duplicado, bajo mi experiencia. Así como las formas de solucionarlos.

Cualquier duda espero vuestros comentarios.

Si este artículo te ha sido de utilidad, valora con 5 estrellas


Artículos relacionados

Jorge Villegas

Jorge Villegas

Jorge Villegas González, Apasionado por el Marketing Digital y la creatividad aplicada al Marketing. Postgrado en Marketing Digital, Social Media & Community y Manager. Redacción de contenidos y consultoría SEO en el departamento de Marketing de InnovaDeluxe.

© IDX Engine by Innovadeluxe Diseño y Desarrollo Web, S.L. Todos los derechos reservados