Un sitemap est un fichier XML énumérant les URL d'un site, utilisé par les moteurs de recherche pour découvrir, prioriser et planifier l'exploration de ces pages.
Le protocole standard de sitemap (sitemaps.org) prend en charge jusqu'à 50 000 URL et 50 Mo par fichier ; les sites plus grands utilisent un index de sitemap référencant plusieurs sous-sitemaps. Chaque entrée d'URL peut inclure <lastmod> (date de dernière modification), <changefreq> (indice) et <priority> (indice). Des extensions de sitemap spécialisées existent pour les images (<image:image>), la vidéo (<video:video>) et les actualités (<news:news> pour le contenu de moins de 2 jours).
Pour le commerce électronique, les structures de sitemap courantes : un index de sitemap à /sitemap.xml pointant vers /sitemaps/products.xml, /sitemaps/categories.xml, /sitemaps/brands.xml, /sitemaps/pages.xml, /sitemaps/blog.xml, et /sitemaps/images.xml. Chaque sous-sitemap est paginé si elle dépasse la limite de 50k URL.
Les sitemaps sont soumis via Google Search Console, Bing Webmaster Tools et Yandex Webmaster. La soumission d'un sitemap ne garantit pas l'exploration ou l'indexation — Google utilise le sitemap comme l'un des nombreux signaux.