Un sitemap es un archivo XML que enumera las URLs de un sitio, utilizado por los motores de búsqueda para descubrir, priorizar y programar el rastreo de esas páginas.
El protocolo estándar de sitemap (sitemaps.org) admite hasta 50,000 URLs y 50MB por archivo; los sitios más grandes utilizan un índice de sitemap que referencia múltiples sub-sitemaps. Cada entrada de URL puede incluir <lastmod> (fecha de última modificación), <changefreq> (sugerencia) y <priority> (sugerencia). Existen extensiones de sitemap especializadas para imágenes (<image:image>), video (<video:video>) y noticias (<news:news> para contenido de menos de 2 días).
Para ecommerce, las estructuras de sitemap comunes: un índice de sitemap en /sitemap.xml que apunta a /sitemaps/products.xml, /sitemaps/categories.xml, /sitemaps/brands.xml, /sitemaps/pages.xml, /sitemaps/blog.xml y /sitemaps/images.xml. Cada sub-sitemap se paginará si excede el límite de 50k URLs.
Los sitemaps se envían a través de Google Search Console, Bing Webmaster Tools y Yandex Webmaster. La presentación del sitemap no garantiza el rastreo o la indexación; Google utiliza el sitemap como una de muchas señales.