Hoy hablamos del conocido archivo, el Sitemap. Un archivo utilizado por la mayoría de proyectos en Internet, y muy pocos lo utilizan correctamente.
Quería hablar de esto antes y ya era hora, ya que la mayoría de las veces este archivo pasa desapercibido y es generado automáticamente por un complemento o módulo y nunca más se vuelve a tocar. Y la verdad es que son muchos los beneficios de los que quiero hablarte en este artículo.
En este artículo quiero resumir algunos aspectos que encontramos en nuestro día a día con los Sitemaps y las soluciones que elegimos dependiendo del proyecto, el alcance y el estado del proyecto.
¿Qué es un mapa del sitio?
Un mapa de sitio es un archivo que se utiliza para marcar cualquier URL de un proyecto web en cualquier motor de búsqueda (en este caso Google), de modo que los robots puedan indexar dicho proyecto de manera más eficiente. Además, el mapa del sitio también te asegura que los robots recopilarán esta información antes y cómo la utilizan depende de otros factores que explicaré en este artículo.
Formatos en los que podemos generar un Sitemap.
- XML: Este es el más utilizado y lo recomiendo. La mayoría de complementos, módulos y extensiones utilizados por gestores de contenidos como WordPress, Prestashop o Magento utilizan este formato.
- RSS: Si tiene un feed generado que automatiza la carga de contenido nuevo, puede incluirlo como mapa del sitio, pero tenga cuidado con esto ya que la mayoría de los feeds olvidan muchas páginas antiguas que no se generan automáticamente.
- Documento de texto: También puede incluir archivos .txt para generar su mapa del sitio. Por supuesto, debes incluir una URL por línea.
- Páginas de Google: Otra forma de crear tu Sitemap que no recomiendo, pero que Google permite su uso, Os dejo toda la información aquí..
Cabe destacar que también puedes crear sitemaps para imágenes, vídeos o móviles, pero esto es algo que veo que cada día se implementa más en los proyectos con los que me encuentro.
IMPORTANTE: Hasta este punto sólo hemos dado una descripción general de qué es un mapa del sitio y qué formatos puede utilizar. Nada que no puedas encontrar en las directrices de Google como siempre digo (está todo ahí, no en otros sitios 😉).
Si no conocías todos sus usos, te dejé algunos enlaces a la documentación oficial de Google. ¡Ahhh! Ten en cuenta que no puedes generar Sitemaps con más de 50.000 URL, aunque según mi experiencia recomiendo no superar las 40.000. Cuando tiene miles de URL, es recomendable crear un índice de mapa del sitio.
Algo que debes tener en cuenta y que no se considera en la mayoría de los casos son los siguientes aspectos:
- No incluya URL con Noindex en el mapa del sitio
- No incluya URL de mapas del sitio que no coincidan con el código 200
- No incluya URL NO canónicas en el mapa del sitio
ESTAS SON LAS 3 REGLAS DE ORO DEL MAPA DEL SITIO 😉
IMPORTANTE: Sitemap no se utiliza para indexar URL, es cierto que la generación adecuada de Sitemaps ayuda a la indexación, pero no sirven para indexar y mucho menos este es un archivo obligatorio. Cualquier sitio web pequeño o mediano no necesita un mapa del sitio para que Google indexe sus URL, bastaría con un buen enlace interno.
Te dejo aquí un caso de éxito, para que puedas correr la voz y ver cómo un buen uso de los Sitemaps puede mejorar la búsqueda, la indexación y el tráfico: https://moz.com/blog/multiple-xml-sitemaps-Increased-indexing- y- tráfico
Errores al generar Sitemaps
En los últimos años revisando sitios web y trabajando en diferentes proyectos me he encontrado con todo tipo de cosas sobre el tema Sitemaps, pero la que destaca por encima de todas es esta:
- Incluya URL que respondan a códigos 301.
- Incluya 404 URL coincidentes.
- Incluya URL que apunten canónicamente a otra URL.
- Incluye URLs bloqueadas por Robots.txt (esto es lo mejor xD).
Es muy fácil comprobar que nada de esto está sucediendo en tu proyecto, sólo necesitas el Sitemap del proyecto y Screaming Frog (En caso de que aún no estés familiarizado con esta herramienta, aquí tienes el completo Guía de la rana gritadora). Te explico el procedimiento en varios pasos:
PASO 1: Descargue el archivo del mapa del sitio para trabajar con el documento.
PASO 2: Ejecute Screaming Frog >> Modo >> Lista >> Cargar lista >> desde archivo >> seleccione Sitemap xml. Con esto podrás subir tu Sitemap para analizarlo en profundidad y eliminar los errores que pueda generar.
PASO 3: Identificar errores y generar Sitemap correcto. Esto mejorará significativamente el seguimiento. Dependiendo del estado de tu Sitemap, esta mejora de seguimiento puede hacer que tu proyecto empiece a mejorar posiciones.
¿Cuándo deberías hacer esta verificación?
En general, enumeraré algunas situaciones en las que esta comprobación es muy importante, además de generar un nuevo sitemap que permita al robot de Google recorrer tu sitio web de forma más inteligente:
- Si has implementado HTTPS conocido en tu sitio, entonces el momento clave es revisar tu Sitemap y verás la cantidad de 3xx que encontrarás.
- Si ha migrado o cambiado URL recientemente. Encontrarás sorpresas como: 301 y 404 xD.
- Si realmente te gusta jugar con Noindex o utilizar un complemento para generar tu mapa del sitio, seguramente encontrarás URL no indexadas para incluir en tu mapa del sitio.
- Si realmente te gusta usar “canonical”, definitivamente encontrarás sorpresas desagradables en tu mapa del sitio.
2 usos avanzados de los mapas de sitio
Un mapa de sitio tiene diferentes propósitos. Aquí te explicaré en qué situaciones los uso y el motivo de cada una de estas acciones que realizo:
1. Acelera la desindexación de una gran cantidad de URL gracias a Sitemap
¡Comencemos con el primer escenario común! Tenemos una cantidad de URL innecesarias que queremos desindexar por cualquier motivo (no quiero entrar en detalles, de lo contrario, esto llevaría una eternidad; explicaremos por qué a menudo necesitamos desindexar las URL en publicaciones futuras). Imagínese que hay cientos o miles de ellos. No puedes esperar a que Google revise cada uno según su frecuencia de indexación.
Para acelerar este proceso de desindexar una gran cantidad de URL, simplemente necesitamos generar un Sitemap que incluya todas las URL que ya tenemos con noindex y subirlas a Search Console. Para ello le pedí a mi colega Julio que descargara gratuitamente una herramienta generadora de mapas de sitios que puedes encontrar aquí, ya que Screaming Frog y otras herramientas causan problemas con este tipo de URL.
Después de que haya pasado mucho tiempo, simplemente tomamos todas esas URL y verificamos si están desindexadas usando URL Profiler (explicaré esta herramienta más adelante). Simplemente insertas todas las URL y seleccionas la opción “Indexación de Google”.
Una vez desindexados, eliminamos el mapa del sitio de Search Console.
2. Cree un mapa del sitio para una eliminación de URL más rápida
¡Este escenario aparece en muchas tiendas electrónicas! Imagina que tienes un negocio de comercio electrónico y trabajas con temporadas de productos y de repente tienes que eliminar diferentes categorías y productos por diferentes motivos. Ojo cuando esto suceda, hay varias opciones:
- Asegúrese de que ninguna URL tenga enlaces externos que proporcionen autoridad.
- Revisa el tráfico orgánico de esas URL, porque si tengo algunas URL con tráfico, nunca las eliminaría.
- Asegúrese de que no haya productos similares, porque si los hay y recibimos tráfico a esas URL, es posible que obtengamos un 301.
ACERCA DE: Algo muy común en los negocios electrónicos son las redirecciones a otras partes del sitio web. En los puntos anteriores ya he comentado qué comprobar antes de tomar una decisión. El problema de crear redirecciones sin sentido común y sin análisis es que se generarán códigos de software 404 y, si continúas con esta práctica, tu Search Console se inundará de ellos.
- Si ya ha decidido que necesita eliminar estas URL porque no tienen tráfico ni enlaces externos que brinden autoridad, estas URL tampoco existirán más. Simplemente necesita hacer que esas URL devuelvan un código 410.
- Crea un Sitemap con todas las URL que coincidan con 410. Recuerda que puedes crear uno con esta herramienta gratuita.
- Después de que haya pasado mucho tiempo, simplemente tomamos todas esas URL y verificamos si están desindexadas usando URL Profiler. Simplemente insertas todas las URL y seleccionas la opción “Indexación de Google”.
- Una vez desindexados, eliminamos el mapa del sitio de Search Console.