Uno de los problemas típicos de una tienda online son los contenidos duplicados que se pueden dar, básicamente, por:
Nutricion enteral y parenteral
● Paginaciones, filtros o parámetros de facetado y ordenación
● Copiar / pegar de catálogos
● Versiones idiomáticas sin traducir
● Variaciones de un mismo producto repartidas en diferentes URLs
● Versiones sin canonical de la página con www/sin www, con https/sin https, con amp/sin amp
En realidad, tiene fácil arreglo, así que no paniquemos. Lo que sí debemos tener en cuenta es que el algoritmo que filtra los contenidos en Google es potente y aprende muy rápido. Se llama Google Panda (lo hemos visto al principio) y es capaz de hacer cosas como estas a tu tráfico orgánico:
A lo tonto, te va chupando el tráfico orgánico poco a poco, debido a que va filtrándote en las búsquedas.
Paginaciones, filtros o parámetros de facetado y ordenación
La solución más utilizada para resolver estos problemas es el uso de los canonicals, las etiquetas “noindex”, el archivo robots.txt y los parámetros de URL dentro de Google Search Console.
Básicamente debemos hacer que:
1. las URLs derivadas lleven un canonical a la original
2. que lleven “noindex, follow” en el tag del header
3. incluir los parámetros en el robots.txt
4. y cerrar esos parámetros en el Search Console de Google
¿Qué es el Contenido Duplicado?
El contenido duplicado se refiere a bloques de texto idénticos o muy similares que aparecen en más de una URL en internet. Esto puede ocurrir dentro de un mismo sitio web (contenido duplicado interno) o entre diferentes sitios web (contenido duplicado externo). Las principales causas de contenido duplicado incluyen:
- Versiones de URL: URLs con y sin «www», con y sin «https», o con y sin parámetros de seguimiento.
- Contenido Similar: Páginas que tienen contenido casi idéntico debido a plantillas o formatos similares.
- Copias Intencionales: Publicaciones duplicadas deliberadamente para manipular los resultados de búsqueda.
Impacto del Contenido Duplicado en SEO
- Dilución de la Autoridad: Cuando hay múltiples versiones de una página compitiendo, la autoridad de la página se divide entre ellas.
- Penalizaciones: Google puede penalizar sitios con contenido duplicado, especialmente si es considerado como un intento de manipular el ranking.
- Experiencia del Usuario: Puede confundir a los usuarios si encuentran varias versiones de la misma información.
Cómo Manejar el Contenido Duplicado
1. Redirecciones 301
Utiliza redirecciones 301 para consolidar varias versiones de una URL en una única versión preferida. Por ejemplo:
# Redirigir HTTP a HTTPS y www a no-www en Apache
RewriteEngine On
RewriteCond %{HTTPS} off [OR]
RewriteCond %{HTTP_HOST} ^www\.example\.com [NC]
RewriteRule ^(.*)$ https://example.com/$1 [L,R=301]
2. Etiqueta Canonical
Usa la etiqueta <link rel="canonical">
en todas las páginas duplicadas para indicar a los motores de búsqueda cuál es la URL preferida que debe indexarse. Por ejemplo:
<!-- En la versión sin www -->
<link rel="canonical" href="https://example.com/mi-pagina"><!-- En la versión con www -->
<link rel="canonical" href="https://example.com/mi-pagina">
3. Parámetros de URL
Gestiona los parámetros de URL utilizando herramientas como Google Search Console para especificar qué parámetros son importantes y cuáles deben ser ignorados por los motores de búsqueda.
4. Contenido Único y Valioso
Asegúrate de que cada página de tu sitio tenga contenido único y valioso que ofrezca información relevante y diferenciada.
5. Herramientas de Monitoreo
Utiliza herramientas como Google Search Console y herramientas de SEO para identificar y corregir problemas de contenido duplicado.