¿CONTENIDO DUPLICADO? Este es uno de los mayores errores que solemos encontrarnos los SEOs, de hecho, incluso tú puede que tengas contenido duplicado y no te hayas dado ni cuenta. Vamos a ver diferentes herramientas y métodos para detectarlo y solucionarlo.
Después de leer este artículo no vas a dejar ni rastro de contenido duplicado en tu web. Si lo tienes, no te has dado cuenta y lo solucionas, puede que notes una subida en el ranking de Google.
Algunas de las herramientas que vas a encontrar a continuación son imprescindibles si te dedicas al SEO de manera profesional y sobre todo si tienes redactores a tu cargo.
¿Qué se considera contenido duplicado?
Tabla de contenidos
En este punto te remito a las Directrices de Google para Webmasters, más concretamente al apartado en donde hablan del contenido duplicado.
Google considera contenido duplicado los bloques de contenido que coinciden exactamente en todas sus palabras o que se asemejan bastante.
Podemos distinguir 2 tipos de contenido duplicado según afecten a tu web o a webs externas:
1) Contenido duplicado interno.
2) Contenido duplicado externo.
👀 ¡Ojo! Google considera contenido duplicado a los bloques cuyas palabras SE PARECEN a otro contenido ya indexado. Con la actualización de Google Bert, el buscador entiende a la perfección la semántica y sinónimos de las palabras por lo que si copias el contenido de una web y simplemente cambias las palabras por sinónimos, estás jugando con fuego.
Contenido duplicado interno
Raven Tools, una herramienta de SEO todo en uno, hizo una auditoría de contenido de cientos de miles de webs y el 29 % tenían problemas de contenido duplicado.
Diferentes URLs de la misma web
Lo primero que tienes que hacer cuando creas una web es asegurarte que la versión con 3 Ws de tu web redirije a la url sin las 3 Ws… o viceversa.
Por ejemplo, yo he elegido que se muestre por defecto mi web con las 3 Ws. Si suprimo las urls, tiene que haber una redirección automática a la versión con Ws.
Tienes que hacer la misma comprobación sin el protocolo de seguridad, es decir, quita la ‘s’ del https para ver si te redirige a la versión segura.
WordPress hace estas redirecciones muy bien por defecto pero si has utilizado otro CMS o una web a medida, comprueba que todas las versiones de tu url redirijan a la que quieres que salga por defecto.
Mismo contenido indexado en diferentes partes de tu web
Ejemplo: una tienda online que tiene el mismo contenido en https://tutienda.com/pantalon-marron y en https://tutienda.com/oferta-unica
Tienes que tener cuidado con esos pequeños detalles así como con las categrías y etiquetas de WordPress. Configúralas para que siempre ofrezcan un ‘excerpt’ o resumen de los post y dale variedad de categorías a tu blog no vaya a ser que https://tublog.com sea lo mismo que https://tublog.com/category/curiosidades.
Una opción es desindexar categorías y etiquetas mediante el plugin Yoast SEO y sustituirlas por páginas mejor trabajadas con urls en silo.
Contenido duplicado externo
Tiendas online que duplican el contenido de sus proveedores
Si vas a indexar los productos de tu ecommerce procura que estos tengan descripciones únicas y que tengan al menos 250 palabras para evitar penalizaciones por ‘thin content’ (demasiadas urls con contenido escaso o pobre que no aporta nada).
El contenido que han creado tus redactores ya existe
En este caso no tiene porqué coincidir al 100 %. Pueden existir muchos grados de coincidencia. En cualquier caso, si varias partes del artículo coinciden exactamente con partes ya indexadas de otro artículo, Google lo considera contenido duplicado.
Herramientas para detectar contenido duplicado interno
Antes de meternos más a fondo con las soluciones a problemas de contenido duplicado, vamos a ver las diferentes herramientas que podemos usar para detectarlo:
Screaming Frog
Esta herramienta es una joya para los SEOs técnicos ya que te desgrana toda una web y te detecta contenido duplicado, cadenas de redirecciones, códigos de estado de todas las páginas, longitud de los títulos, etc.
Es una herramienta muy útil para auditar webs grandes y comprobar que no existan errores de contenido duplicado.
TIP: ten en cuenta los recursos que puede que no te interese rastrear para ahorrar tiempo de rastreo. Puedes desmarcar imágenes, CSS, JavaScript y recursos SWF para reducir el tamaño del rastreo.
Siteliner
Esta herramienta es una auténtica delicia. Es completamente gratuita. Si no te registras te analiza hasta 250 páginas de un mismo dominio y la versión premium se obtiene solo registrándote y te permite analizar hasta 25.000 páginas.
Lo mejor de todo es que no solo detecta contenido duplicado sino también otra clase de problemas como:
- Páginas en donde tienes enlaces rotos.
- Páginas que tienen un 'noindex'. Esto no supone necesariamente un problema pero viene muy bien para ver si se han solucionado urls que pueden suponer un problema de cara al SEO.
- Tiene una sección en donde compara el peso medio, los tiempos de carga y el número de palabras por página con la media de otras webs similares:
Herramientas para detectar contenido duplicado externo (plagios)
Dupli Checker
Esta herramienta es mucho más sencilla. Puedes copiar y pegar un texto para ver si está duplicado en alguna otra web o directamente pegar una url que quieras comprobar.
Es gratuita. Viene muy bien para aquellos que tienen redactores y que entregan sus documentos en Word ya que puedes cargar archivos. También admite archivos .txt.
Plagiarism Detector
Detectar contenido duplicado externo.
Esta es otra herramienta similar a Dupli Checker. También es muy útil para aquellos que trabajan con redactores y totalmente gratuita.
Funciona de la misma manera que la anterior aunque quizá su búsqueda sea más profunda, o eso dice su web. Puedes pegar un texto del artículo que te hayan pasado o subir un documento si hace falta.
Copyscape
Detectar contenido duplicado externo.
Esta herramienta es de las míticas que siempre ha existido y que todos usábamos antes de que surgieran otras mejores.
Su versión gratuita es muy sencilla. Copias y pegas una url y detecta en qué otras urls hay contenido duplicado.
Gracias a este herramienta se han descubierto muchos plagiadores de webs que no sé qué pretenden copiando el contenido de otras webs.
Su versión premium tiene un robot de rastreo más potente y trae otras funcionalidades como por ejemplo mandarte un email de forma automática cada vez que alguien te copia contenido.
El precio viene determinado por el número de palabras que tenga que analizar: 1 centavo de dólar cada 100 palabras.
Formas de protegerse si te copian el contenido
En este mundo de las webs es habitual que cuando alguna de ellas alcanza cierta visibilidad, sea objetivo de los plagiadores de contenido.
Esto es algo que en principio no debería preocuparte demasiado porque puedes denunciar la web plagiadora ante Google y ésta será penalizada rápidamente. Debes hacerlo en esta url: https://www.google.com/webmasters/tools/dmca-notice?pli=1
Sin embargo, antes de llegar a este extremo, podrías contactar con el webmaster para ver si ha obrado de mala fe:
- Contactar con el webmaster y pedirle o que haga referencia a la autoría original del artículo junto con un enlace a tu web o que directamente elimine el post.
- Si hace oídos sordos es entonces cuando puedes denunciarlo ante Google e iniciar una campaña en redes sociales para que se sepa lo que ha hecho... junto con las pruebas, claro.
- Puedes sustituir las imágenes que ha copiado de tu servidor poniendo otras en las que denuncies lo que ha hecho. Tendrás que mantener la misma estructura de url para que aparezcan en su web.
Soluciones al contenido duplicado
URL Canonical
Si tienes contenido duplicado interno o muy similar, una opción es decirle a Google qué página quieres que tome como prioridad. Esto se hace mediante la etiqueta rel canonical que puedes añadirla mediante el plugin de Yoast SEO.
En la sección avanzada del Yoast SEO está el campo donde debes insertar la url que quieres que lleve la etiqueta ‘rel canonical’. Si ese post es similar a otro o está canibalizando, deberás introducir la url del post que quieres que Google tome como prioridad.
Si quieres saber lo que dice Google acerca de esta etiqueta, te dejo este enlace.
Meta Noindex
Esta es la solución radical para eliminar una url que tenga contenido duplicado. También lo puedes hacer con el plugin Yoast SEO.
Seleccionando el ‘No’ en ese campo se coloca automáticamente el Noindex en esa página o post. Después de hacer esto conviene ir a Search Console y solicitar la eliminación de esa url de los resultados de búsqueda (en el caso de que ya estuviera indexada).
Redireccionamiento 301
Otra solución puede ser un redireccionamiento 301 del post duplicado al original. Esto no lo puedes hacer con el plugin de Yoast pero te recomiendo el 301 Redirects – Easy Redirect Manager.