Sitemap XML 验证器

验证您的 sitemap.xml 语法,检查 URL,并捕获常见问题

什么是 Sitemap?

Sitemap(站点地图)是一个 XML 文件,列出了您希望搜索引擎发现和索引的网站上的所有页面。它帮助像 Googlebot 这样的网络爬虫找到那些仅通过内部链接可能不易被发现的页面。Sitemaps 可以包含页面最后更新时间、更改频率及其相对优先级等元数据。

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/page</loc>
<lastmod>2024-01-15</lastmod>
</url>
</urlset>

Sitemap 类型

URL 集合 (urlset)

标准的 sitemap 格式。列出带有可选元数据的单个页面 URL。每个文件最多可以包含 50,000 个 URL,未压缩前必须小于 50MB。

Sitemap 索引 (sitemapindex)

引用多个 sitemap 文件的主文件。当您的网站有超过 50,000 个 URL 时使用此选项 - 将它们分散在多个 sitemap 中并在索引中列出它们。

XML 元素

<loc> (必填)

页面的绝对 URL。必须以 http:// 或 https:// 开头,并与您的规范 URL 完全匹配。

<lastmod> (推荐)

页面最后修改的日期,采用 W3C Datetime 格式 (例如: 2024-01-15 或 2024-01-15T09:30:00+00:00)。

<changefreq> (可选)

页面可能更改的频率。取值: always, hourly, daily, weekly, monthly, yearly, never。Google 在很大程度上会忽略此项。

<priority> (可选)

在您的网站中的相对重要性 (0.0 到 1.0)。这只是一个提示 - 搜索引擎可能会忽略它。默认值为 0.5。

最佳实践

  • 仅包含规范 URL - 不要列出重定向、404 或非规范版本
  • 保持 lastmod 准确 - 仅在页面内容实际更改时更新它
  • 在 Google Search Console 的“站点地图”下提交您的 sitemap 以加快发现速度
  • 在 robots.txt 中引用您的 sitemap: Sitemap: https://example.com/sitemap.xml
  • 当您有超过 50,000 个 URL 或多种内容类型时,使用 sitemap 索引
  • 对大型 sitemap 使用 gzip 压缩 - Google 接受 .xml.gz 文件

常见问题 (FAQ)

Google 需要 Sitemap 吗?

不。Google 可以通过链接发现大部分页面。但是,sitemap 有助于大型网站、缺乏反向链接的新网站、拥有富媒体的页面以及内容频繁更新的网站。

大小限制是多少?

每个 sitemap 文件最多可以包含 50,000 个 URL,并且未压缩前必须不超过 50MB。如果您超出了这些限制,请将您的 URL 分散在多个 sitemap 文件中并使用 sitemap 索引。

Google 使用 changefreq 和 priority 吗?

Google 已经声明它在很大程度上忽略了 changefreq 和 priority 的值。lastmod 日期是最有用的元数据信息 - 但前提是它能准确反映内容实际修改的时间。

我应该在 sitemap 中包含每一页吗?

包含所有您希望被索引的页面。不要包含被 robots.txt 屏蔽的页面、noindex 页面、重定向或错误页面。您的 sitemap URL 应匹配每页的规范版本。

我应该在哪里托管我的 sitemap?

将其放置在您域名的根目录下 (https://example.com/sitemap.xml) 以获得最佳的发现性。sitemap 只能包含其所在同一域名的 URL。