Desindexar
¿Qué es desindexar una URL en SEO?
La desindexación es la acción de eliminar una página web o un conjunto de páginas web indexadas por los motores de búsqueda. La desindexación puede ser una medida preventiva para evitar que se indexen páginas duplicadas, contenido no original o contenido que no cumple con las pautas de calidad del motor de búsqueda.
En SEO, la desindexación es una técnica muy útil para controlar el proceso de indexación del sitio web, lo que proporciona un mejor control y gestión del tráfico y la reputación en línea. También puede mejorar el rendimiento del site al eliminar contenido duplicado.
Razones para desindexar
Puede haber diversas razones por las cuales se debe considerar la desindexación:
- Duplicidades: si hay varias versiones similares o iguales de una página son detectadas por los motores de búsqueda, esta puede afectar negativamente al posicionamiento. Para solucionarlo debemos identificar la versión original y marcar como “no-index” las demás.
- Páginas irrelevantes: son aquellas páginas cuyo contenido no guarda relación con el tema principal abordado en el sitio web. Es importante detectarlas e indicar a los buscadores marcándolas cómo “no-index” para que éstos hagan caso omiso.
- Main Issues: limpieza general en la estrategia SEO donde se retiran contenidos obsoletos o rara vez visitados. De esta manera, solo nos enfocamos en aquellos contenidos realmente relevantes y aumentamos su autoridad frente a Google.
Cómo desindexar contenido
A continuación detallamos cómo hacerlo:
- Borrar directamente las URLs: eliminar directamente las URL’s innecesarias desde Google Search Console. Puede demorarse algunas semanas.
- No-Index HTML tag: si quieres eliminar todo tu sitio web puedes hacerlo agregando meta tags ‘no -Index’ a cada pagina HTML usando ficheros robots.txt sin sitemaps. Añadir estas etiquetas suele ser algo tedioso cuando se habla de miles/millones paginas, aunque puede solventarse utilizando herramientas automatizadas.
- Método HTTP Headers/Header tags: también puedes especificarlo mediante HTTP Headers/header tags desde el servidor donde está alojado dicho contenido. Este método es más agil cuando hablamos de más de 10 mil páginas pero su implementaciín es más complicada.
Inconvenientes al desindexar contenido
Al desindexar contenido en SEO se pueden presentar varios inconvenientes, entre ellos:
- Pérdida de visibilidad: Si se desindexa una página o contenido relevante, se reduce la posibilidad de que los usuarios lo encuentren en los resultados de búsqueda y, por lo tanto, disminuye la visibilidad de la marca o empresa.
- Disminución del tráfico orgánico: Al desindexar contenido, se limita la cantidad de tráfico orgánico que puede llegar al sitio web. Esto puede afectar negativamente las métricas de tráfico y conversión.
- Pérdida de autoridad: Si se desindexa contenido relevante y de calidad, se puede perder autoridad en el ámbito del SEO. Los motores de búsqueda valoran el contenido de calidad y relevante para posicionar mejor un sitio web.
- Dificultad para rastrear y indexar nuevas páginas: Si se desindexan muchas páginas, los motores de búsqueda pueden tener dificultades para rastrear y indexar nuevas páginas. Esto puede retrasar el proceso de indexación y afectar la visibilidad de nuevas páginas o contenido.
- Pérdida de enlaces entrantes: Si se desindexa una página que tiene enlaces entrantes, se puede perder el valor de esos enlaces para el SEO. Los enlaces entrantes son un factor importante para el posicionamiento en los motores de búsqueda.
- Dificultad para recuperar contenido desindexado: Si se decide volver a indexar contenido que ha sido desindexado, puede ser un proceso complicado y llevar tiempo. Los motores de búsqueda pueden no rastrear y indexar de inmediato el contenido que se ha vuelto a indexar.
En resumen, desindexar contenido en SEO puede tener consecuencias negativas en términos de visibilidad, tráfico, autoridad y rastreo/indexación. Por lo tanto, es importante considerar cuidadosamente los pros y contras antes de tomar la decisión de desindexar contenido.
Preguntas frecuentes:
¿Cómo saber que páginas o URLs ha desindexado Google?
Para saber qué páginas o URLs ha desindexado Google, puedes utilizar varias herramientas y métodos:
- Herramienta de inspección de URLs de Google Search Console: Esta herramienta te proporciona información sobre la versión indexada por Google de una página específica. Puedes comprobar si una URL puede ser indexada y obtener detalles sobre datos estructurados, indexación y más.
- Informe “Indexación de páginas” en Google Search Console: Este informe te muestra qué páginas puede encontrar e indexar Google en tu sitio y si se ha detectado algún problema de indexación. También puedes usar la sintaxis `site:tu_dominio.com` en Google para ver qué páginas están indexadas.
- Comando de búsqueda avanzado: Utiliza el comando `site:tudominio.com` en Google para conocer qué URLs están indexadas y cuáles no. Las que no aparezcan pueden haber sido desindexadas.
- Índice de Cobertura de Search Console: Estudia el índice de Cobertura para ver qué URLs son válidas y cuáles están excluidas. Esta es una de las mejores maneras de saber si se ha desindexado contenido de tu página web.
Recuerda que para usar estas herramientas, debes tener acceso a Google Search Console como propietario o administrador del sitio web en cuestión. Si encuentras que una página importante ha sido desindexada sin motivo aparente, puedes solicitar una nueva indexación a través de la herramienta de inspección de URLs.
¿Por qué se desindexa sola una página web?
Una página web puede desindexarse automáticamente por varias razones. Aquí te menciono algunas de las más comunes:
- Contenido duplicado: Si el contenido de una página ya se ha publicado en otro sitio, Google puede considerarlo duplicado y optar por no indexarlo.
- Thin Content: Contenido que es demasiado escaso o no responde adecuadamente a la consulta del usuario puede ser desindexado.
- Canonicalización automática: Google puede decidir que una URL es similar a otra y redirigirla automáticamente, lo que resulta en la desindexación de la URL original.
- Falta de tráfico o enlaces internos: Si una página no recibe suficiente tráfico o enlaces internos, Google puede considerarla no importante y desindexarla.
- Errores 400 o 500: Errores como los de cliente (400) o de servidor (500) pueden hacer que una URL previamente indexada sea desindexada si Google no puede acceder a ella.
- Directivas noindex: Si se ha configurado una normativa noindex para una URL, se le indica a Google que no la incluya en sus resultados de búsqueda.
- Presupuesto de rastreo: A veces se desindexan páginas para optimizar el rastreo de Google y aprovechar mejor el presupuesto de rastreo.
Para evitar la desindexación no deseada, es importante asegurarse de que el contenido sea original, relevante y de calidad, y que la página web esté libre de errores técnicos que impidan el acceso de los motores de búsqueda. Además, es útil monitorear la indexación de las páginas a través de herramientas como Google Search Console.
Referencias:
- Google. (2023, June 6). Site removed from the Google index. https://support.google.com/webmasters/answer/40052?hl=en
- Conductor. (2023, June 21). How to Remove URLs from Google Search in a Snap! https://www.conductor.com/academy/google-remove-urls/
¿Quieres aprender a crear contenidos SEO un 90% más rápido gracias a la IA?