Qué son los sitemaps XML

Qué son los sitemaps XML

¿Qué es un sitemap?

Un sitemap es un archivo, por lo general en formato XML, que contiene una lista con todas las páginas que queremos indexar de nuestro sitio. Los robots de los buscadores aprovechan este archivo para conocer todas la páginas que deben rastrear e intentar indexar de un sitio.

Por lo general no importa el orden en que se incluyan las URLs del sitio dentro de este archivo, aunque se puede incluir un atributo de prioridad, no hay evidencias de que los buscadores lo tengan en cuenta para seleccionar la frecuencia de rastreo. También se puede incluir una fecha de última actualización del contenido de cada página, esta información se puede utilizar para priorizar el rastreo en las páginas que hayan cambiado, pero no para forzar el rastreo sobre páginas que no lo necesiten porque no hayan cambiado.

Enviar un archivo sitemap mediante Google Search Console

Aunque se puede comunicar el sitemap de nuestro sitio a través del archivo robots.txt, enviar este archivo mediante la correspondiente funcionalidad de Google Search Console nos ofrece, no solo comunicar las páginas de nuestro sitio a Google, además podemos obtener datos sobre el número de páginas indexadas de las que hemos enviado en el archivo sitemap.

Saturación de la indexación del sitemap

La saturación de la indexación indica el porcentaje de páginas indexadas con respecto al enviado en el sitemap, lo ideal es que este porcentaje esté siempre lo más cercano posible al 100%.

Archivo sitemap enviado con Google Search Console
Saturación de la indexación 83%

Si el porcentaje de saturación es muy bajo, dicho de otro modo, se han indexado un bajo número de páginas con respecto al enviado, deberemos analizar la posible presencia de contenido duplicado.