Eine Sitemap ist eine XML-Datei, die die URLs einer Website auflistet und von Suchmaschinen verwendet wird, um diese Seiten zu entdecken, zu priorisieren und das Crawlen zu planen.
Das Standard-Sitemap-Protokoll (sitemaps.org) unterstützt bis zu 50.000 URLs und 50MB pro Datei; größere Websites verwenden einen Sitemap-Index, der auf mehrere Unter-Sitemaps verweist. Jeder URL-Eintrag kann <lastmod> (Datum der letzten Änderung), <changefreq> (Hinweis) und <priority> (Hinweis) enthalten. Es gibt spezialisierte Sitemap-Erweiterungen für Bilder (<image:image>), Videos (<video:video>) und Nachrichten (<news:news> für Inhalte, die weniger als 2 Tage alt sind).
Für E-Commerce sind gängige Sitemap-Strukturen: ein Sitemap-Index unter /sitemap.xml, der auf /sitemaps/products.xml, /sitemaps/categories.xml, /sitemaps/brands.xml, /sitemaps/pages.xml, /sitemaps/blog.xml und /sitemaps/images.xml verweist. Jede Unter-Sitemap wird paginiert, wenn sie das Limit von 50.000 URLs überschreitet.
Sitemaps werden über die Google Search Console, die Bing Webmaster Tools und die Yandex Webmaster eingereicht. Die Einreichung einer Sitemap garantiert kein Crawlen oder Indizieren — Google verwendet die Sitemap als eines von vielen Signalen.