Como gestionar el contenido duplicado con directivas SEO

En mi experiencia con clientes, el contenido duplicado es uno de los problemas más recurrentes y, a la vez, más sencillos de resolver si sabes dónde tocar. Cuando Google encuentra varias versiones de una misma página, tiene que decidir cuál es la original. Si no le das las señales correctas, corres el riesgo de que elija la que no quieres o, peor aún, que no posicione ninguna.

Identifica el origen de tus variantes

La duplicidad aparece por muchas vías, a menudo sin que te des cuenta. He visto proyectos donde el mismo contenido es accesible mediante subdominios (con o sin www), diferentes protocolos (http vs https), o incluso por la presencia o ausencia de una barra final (trailing slash). Estas variantes, si no se gestionan, fragmentan tu autoridad.

Otro escenario muy frecuente ocurre con los parámetros dinámicos, típicos en filtros de e-commerce o sistemas de ordenación. Si tu URL cambia al filtrar por precio o categoría pero el contenido es idéntico al de la página base, estás generando duplicidad. Lo mismo sucede con las variantes para dispositivos o, en el peor de los casos, cuando se indexa accidentalmente una versión de desarrollo o staging de tu web.

Soluciones técnicas para una indexación limpia

La clave para resolver esto es la consistencia. Si ya has decidido que tu versión preferida es, por ejemplo, la que usa https, tiene www y termina en barra, debes volcar todas tus señales hacia ella. Lo que mejor me ha funcionado siempre es aplicar las siguientes directivas:

Alex Amigo

¿Necesitas ayuda con tu estrategia SEO?

Trabajemos juntos para hacer crecer tu negocio con una estrategia digital personalizada.

  • Redirecciones 301: Es la forma más potente de consolidar. Si detectas accesos por versiones no preferidas, redirige automáticamente a la original.
  • Etiqueta rel=canonical: Es una sugerencia para Google sobre cuál es la URL original. Asegúrate de incluirla en todas tus páginas apuntando a sí mismas (self-canonical) y, en casos de duplicidad clara, que la versión duplicada apunte a la preferida.
  • Sitemaps: Mantén tu sitemap limpio. Solo incluye las URLs finales, es decir, aquellas que quieres que Google indexe y posicione.
  • Enlazado interno: Evita que tus enlaces internos apunten a versiones alternativas; asegúrate de que todo enlace apunte a la versión canónica.

Recuerda que Google no garantiza la indexación, pero si le facilitas el trabajo, aumentas tus posibilidades de éxito. No intentes bloquear estas versiones con el archivo robots.txt, ya que eso impedirá que Google lea tus directivas. La simplicidad suele ganar: identifica el problema, elige tu versión preferida y sé coherente en todas las señales que envías al buscador.

Preguntas frecuentes

¿Debo usar robots.txt para evitar el contenido duplicado?

No. El archivo robots.txt bloquea el rastreo, lo que impide que Google vea tus etiquetas canonical o meta robots, dejando el contenido duplicado indexado pero sin contexto.

¿Qué es un self-canonical?

Es una etiqueta rel=canonical que apunta a la misma página donde se encuentra. Es una buena práctica para proteger tu contenido frente a parámetros inesperados.

¿Puedo mezclar una etiqueta noindex con un canonical?

No, es un error que genera conflictos. Debes elegir la directiva que mejor se adapte al objetivo de esa URL específica sin combinar ambas.