Llevo más de 15 años trabajando con sitios masivos, de esos que tienen cientos de millones de URLs, y he visto el mismo error repetirse una y otra vez: el uso indiscriminado de la etiqueta meta no index para intentar gestionar el crawl budget. Vamos a dejar las cosas claras: si crees que añadiendo esta etiqueta vas a ahorrar presupuesto de rastreo, te equivocas.
La diferencia entre directivas y señales
Primero, aclaremos conceptos. En SEO, suelo distinguir entre señales y directivas. Un canonical es una señal: le sugieres a Google qué URL prefieres, pero él decide. El meta no index, en cambio, es una directiva. Es una orden clara que Google respeta a rajatabla para no mostrar esa página en los resultados de búsqueda.
El problema es que la gente confunde no indexar con no rastrear. Para que Google pueda leer tu etiqueta no index y obedecerla, necesita acceder a la URL y descargar el HTML. Por tanto, el consumo de recursos ocurre exactamente igual. Google tiene que visitar la página, procesarla y gastar tiempo de su crawler. Si tienes millones de URLs con esta etiqueta, estás haciendo que Google pierda un tiempo valioso que debería dedicar a tu contenido de calidad.
Por qué el meta no index es solo un parche
He visto clientes llenar sus sitios de no index para dormir más tranquilos, pensando que así ocultan contenido basura o duplicado. Pero, al analizar los logs, los hechos son tozudos: Google sigue entrando en esas páginas con la misma frecuencia. Lo que realmente determina si el bot accede o no es la popularidad de la URL, es decir, cuántos enlaces internos o externos apuntan hacia ella.
En mi experiencia, usar el no index sin una arquitectura sólida es ponerle una tirita a una herida abierta. Si no quieres que Google rastree una página, la solución no es una metaetiqueta; la solución es no crearla o no enlazarla. Si es contenido que no aporta valor, el mejor presupuesto de rastreo es aquel que no se gasta en páginas que nunca verán la luz en las SERPs.
Si tienes un sitio web grande, deja de buscar soluciones mágicas. El crawl budget se cuida evitando la generación innecesaria de URLs, limpiando duplicados y asegurando que cada petición que hace el bot tenga un sentido estratégico. El no index no es tu escudo, es solo una forma de admitir que no has controlado la generación de páginas de tu propio site.
Preguntas frecuentes
¿El meta no index impide que Google rastree una URL?
No. Google necesita rastrear y descargar la página para leer la etiqueta, por lo que el presupuesto de rastreo se sigue consumiendo.
¿Qué es más efectivo que el meta no index para el presupuesto de rastreo?
Evitar la generación de URLs innecesarias, eliminar enlaces internos hacia páginas basura o utilizar el archivo robots.txt para bloquear rutas completas.
¿Cómo sé si mi sitio tiene problemas de crawl budget?
Debes analizar los logs de tu servidor para ver qué páginas visita Google y cruzarlos con el tráfico orgánico real; si rastrea miles de URLs que no aportan tráfico, tienes un problema.