Um sitemap é um arquivo XML que enumera as URLs de um site, usado por mecanismos de busca para descobrir, priorizar e agendar a exploração dessas páginas.
O protocolo padrão de sitemap (sitemaps.org) suporta até 50.000 URLs e 50MB por arquivo; sites maiores usam um índice de sitemap referenciando vários sub-sitemaps. Cada entrada de URL pode incluir <lastmod> (data da última modificação), <changefreq> (dica) e <priority> (dica). Existem extensões de sitemap especializadas para imagens (<image:image>), vídeo (<video:video>) e notícias (<news:news> para conteúdo com menos de 2 dias).
Para ecommerce, estruturas comuns de sitemap: um índice de sitemap em /sitemap.xml apontando para /sitemaps/products.xml, /sitemaps/categories.xml, /sitemaps/brands.xml, /sitemaps/pages.xml, /sitemaps/blog.xml e /sitemaps/images.xml. Cada sub-sitemap é paginado se exceder o limite de 50k URLs.
Sitemaps são enviados via Google Search Console, Bing Webmaster Tools e Yandex Webmaster. O envio de sitemap não garante exploração ou indexação — o Google usa o sitemap como um dos muitos sinais.