Sitemap XML 验证器
验证您的 sitemap.xml 语法,检查 URL,并捕获常见问题
什么是 Sitemap?
Sitemap(站点地图)是一个 XML 文件,列出了您希望搜索引擎发现和索引的网站上的所有页面。它帮助像 Googlebot 这样的网络爬虫找到那些仅通过内部链接可能不易被发现的页面。Sitemaps 可以包含页面最后更新时间、更改频率及其相对优先级等元数据。
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/page</loc>
<lastmod>2024-01-15</lastmod>
</url>
</urlset>
Sitemap 类型
URL 集合 (urlset)
标准的 sitemap 格式。列出带有可选元数据的单个页面 URL。每个文件最多可以包含 50,000 个 URL,未压缩前必须小于 50MB。
Sitemap 索引 (sitemapindex)
引用多个 sitemap 文件的主文件。当您的网站有超过 50,000 个 URL 时使用此选项 - 将它们分散在多个 sitemap 中并在索引中列出它们。
XML 元素
<loc> (必填)
页面的绝对 URL。必须以 http:// 或 https:// 开头,并与您的规范 URL 完全匹配。
<lastmod> (推荐)
页面最后修改的日期,采用 W3C Datetime 格式 (例如: 2024-01-15 或 2024-01-15T09:30:00+00:00)。
<changefreq> (可选)
页面可能更改的频率。取值: always, hourly, daily, weekly, monthly, yearly, never。Google 在很大程度上会忽略此项。
<priority> (可选)
在您的网站中的相对重要性 (0.0 到 1.0)。这只是一个提示 - 搜索引擎可能会忽略它。默认值为 0.5。
最佳实践
- ✓ 仅包含规范 URL - 不要列出重定向、404 或非规范版本
- ✓ 保持 lastmod 准确 - 仅在页面内容实际更改时更新它
- ✓ 在 Google Search Console 的“站点地图”下提交您的 sitemap 以加快发现速度
- ✓ 在 robots.txt 中引用您的 sitemap:
Sitemap: https://example.com/sitemap.xml - ✓ 当您有超过 50,000 个 URL 或多种内容类型时,使用 sitemap 索引
- ✓ 对大型 sitemap 使用 gzip 压缩 - Google 接受 .xml.gz 文件
常见问题 (FAQ)
Google 需要 Sitemap 吗?
不。Google 可以通过链接发现大部分页面。但是,sitemap 有助于大型网站、缺乏反向链接的新网站、拥有富媒体的页面以及内容频繁更新的网站。
大小限制是多少?
每个 sitemap 文件最多可以包含 50,000 个 URL,并且未压缩前必须不超过 50MB。如果您超出了这些限制,请将您的 URL 分散在多个 sitemap 文件中并使用 sitemap 索引。
Google 使用 changefreq 和 priority 吗?
Google 已经声明它在很大程度上忽略了 changefreq 和 priority 的值。lastmod 日期是最有用的元数据信息 - 但前提是它能准确反映内容实际修改的时间。
我应该在 sitemap 中包含每一页吗?
包含所有您希望被索引的页面。不要包含被 robots.txt 屏蔽的页面、noindex 页面、重定向或错误页面。您的 sitemap URL 应匹配每页的规范版本。
我应该在哪里托管我的 sitemap?
将其放置在您域名的根目录下 (https://example.com/sitemap.xml) 以获得最佳的发现性。sitemap 只能包含其所在同一域名的 URL。