借助“站点地图”报告,您可以将资源的任何新站点地图告知 Google、查看站点地图提交历史记录,还能查看 Google 在解析您提交的站点地图时遇到的任何错误。
什么是站点地图?我是否需要此报告?
站点地图是网站上的一个文件,可以让 Google 知道应该了解网站上的哪些网页。
- 如果您使用了网站托管服务(比如 Squarespace 或 Wix),这些服务可能会为您管理站点地图,这样的话,您就无需创建自己的站点地图,也无需使用此报告。若想了解站点地图的相关信息,请搜索您的托管服务提供商。
- 如果您的网站规模较小(少于 100 个网页),并且您可以通过追踪首页上的一个或多个链接到达网站上的任何网页,则可能无需使用站点地图或此报告。在这种情况下,只需请求将您的首页编入索引即可(除非您使用的是上述网站托管服务,在这种情况下您无需执行任何操作)。
管理站点地图
如何提交新的站点地图以供抓取:
- 您必须拥有资源的所有者权限,才能使用“站点地图”报告提交站点地图。如果您没有所有者权限,可以改为在 robots.txt 文件中列出站点地图,而不是通过此报告提交它。
- 在您的网站上发布站点地图。
- 站点地图必须使用可接受的站点地图格式之一。站点地图的语法、文件位置等需遵循站点地图指南。
- 建议您将站点地图放在网站的根目录下,但如果您使用网站托管服务(例如 Blogger、Wix 或 GoDaddy),应该阅读相应服务的文档,了解发布站点地图的位置和方式(或者是否有必要发布)。
- 使用 XML 站点地图生成器来创建和测试站点地图,以检查是否存在语法错误。
- 运行测试以确保您的站点地图可供 Google 访问。站点地图必须可供 Googlebot 访问,且不得被任何登录要求屏蔽。您可以通过运行实际网址检查并查看网页抓取是否为“成功”来测试 Googlebot 能否访问站点地图。
- 打开“站点地图”报告,复制您在第 3 步中测试的网址,将其粘贴到“站点地图”报告中的添加新的站点地图框,然后点击提交。
- 站点地图应该会立即被抓取。但是,抓取站点地图中所列的网址可能需要一段时间,而且系统可能不会抓取站点地图中的所有网址,具体取决于网站规模、活动、流量等因素。
- 如果站点地图的状态并非成功,请点击该报告中的相应行以了解失败详情,并阅读下文与错误有关的内容。
定期回来查看,以确认 Google 能否抓取和处理您的站点地图。
重新提交站点地图
删除站点地图
删除某个站点地图的操作会从此报告中移除该站点地图,但 Google 不会忘记该站点地图或其中所列任何网址。如果您想让 Google 停止访问站点地图中列出的网址,请使用 robots.txt 规则。
若要从此报告中删除某个站点地图,请执行以下操作:
- 在主“站点地图”报告中的表格内,找到并点击您要删除的站点地图。
- 在站点地图的详情页面中,点击“更多选项”按钮
- 点击移除站点地图。
- 若要阻止 Google 继续访问该站点地图或其中列出的任何网址,请针对该站点地图或相应网页网址使用下列任一方法:
- 使用 robots.txt 规则阻止 Google 读取它,或者
- 从您的网站中删除对应的站点地图文件或网页,或者
- 添加 noindex 规则或响应标头。(对于站点地图,您需要使用响应标头;对于网页,您可以使用元标记或响应标头。)
站点地图抓取时间表
Google 会在您提交站点地图后立即尝试抓取它。如果这项请求成功了,Google 会继续以与网站抓取时间表无关的速度重新抓取站点地图。
如果未能成功抓取或解析站点地图,Google 会在接下来的几天内继续尝试抓取并处理它。如果这些尝试依然失败,Google 将停止尝试抓取该网址。影响站点地图中个别网址的问题不会使 Google 无法继续读取该站点地图,只要站点地图通常可被抓取和读取即可。
解读此报告
- 在顶级“站点地图”报告页面上,查看针对使用此报告或 API 提交的所有站点地图的 Google 请求的状态。该报告会显示每个站点地图的最后一个请求的状态。每个站点地图都有下列值之一,用于显示上一个请求的状态:
- 成功:系统已成功抓取并读取站点地图,未发现任何错误。
- 无法抓取:Google 无法抓取站点地图。
- 站点地图存在 X 个错误:系统可以抓取并部分读取站点地图,但遇到了一些错误。
- 点击进入特定的站点地图,查看显示站点地图相关信息及请求的详情页面。
- 如果详情页面显示无法读取此站点地图,则表示抓取操作因这些原因之一而失败,如详情页面中所示。展开错误下方的部分可查看更多详情。请尝试解决问题,然后将站点地图重新提交到该报告。如果未能成功抓取站点地图,Google 会再尝试几次,但最终将停止尝试读取该站点地图。
- 如果详情页面显示站点地图可读取,但存在错误,那么您会在该站点地图的详情页面中看到错误列表。展开错误下方的部分可查看错误的更多详情。您可点击此处阅读以详细了解这些错误及其解决方法。
重要提示:
- 此报告仅会显示您使用此报告或 Sitemaps API 提交的站点地图,不会显示通过 robots.txt 引用或其他发现方法找到的站点地图。不过,即便我们已经通过其他方式发现了某个站点地图,您仍能使用此报告提交它,以便跟踪我们的成功率和错误率。
- 此报告只会显示当前资源中的站点地图。如果您没看到预期的站点地图,请确保未混淆 http/https 资源或 www/非 www 资源。
- 如果尝试多次后依然无法抓取某个站点地图,Google 最终将停止尝试读取该站点地图。您应修正错误并重新提交该站点地图。
- 如果 Google 能够读取站点地图,便会记住其中信息。无论之后未能读取还是成功读取相应站点地图,Google 都不会“忘记”之前读取到的信息。不过,有关给定网址的新信息会覆盖这个网址的旧信息。
- 您可在提交的站点地图中添加图片、视频或新闻网址。不过,此报告目前不会显示这些类型网址的任何数据。
- 此报告最多可显示 1,000 项已提交的请求。您可以提交更多站点地图,但此报告只能显示 1,000 个(不按提交顺序显示)。目前无法在 Search Console 中查看更多请求。
- 站点地图网址
- 提交站点地图时指定的确切网址。系统不会跟踪重定向。这里仅显示使用此报告或 Sitemaps API 提交的站点地图。
- 类型
- 站点地图的类型。可能的值包括:
- 站点地图:采用 XML 或文本格式的站点地图。
- 站点地图索引:一个由多个站点地图构成的站点地图。
- RSS:采用 RSS Feed 格式的站点地图。
- Atom:采用 Atom Feed 格式的站点地图。
- 未知:所提交的文件不是已知的站点地图类型,或者站点地图尚未得到处理。
- 提交日期
- 上次使用此报告向 Google 提交站点地图时的日期。
- 上次读取时间
- Google 上次获取站点地图时的时间。仅适用于 Google 能获取站点地图的情况。
- 状态
- 最新抓取的状态。可能的值包括:
- 成功:系统已成功加载并处理站点地图,未发现任何错误。所有网址都将加入待抓取队列。
- 含有错误:站点地图可被抓取,但包含一个或多个错误。所有可从站点地图中解析出的无错误的网址都将加入待抓取队列。点击表格中的站点地图即可查看错误及更多详情的列表。请参阅下文的完整解析错误说明。
- 无法抓取:由于某种原因,系统无法抓取站点地图。请参阅如何排查抓取错误。
- 已发现的网页
- 已从站点地图中解析出的网页网址的数量。对于站点地图索引,该数量即是所有子站点地图中所有网址的数量。重复的网址只会被统计一次。我们无法保证在站点地图中发现的网页网址已经或将会被 Google 抓取或编入索引。您可以按站点地图过滤“网页索引编制”报告,以查看此站点地图中有多少网页网址已被编入索引。
- 已发现的视频
- 从站点地图中解析出的视频网址的数量。这无法保证这类网址已经或将会被 Google 抓取或编入索引。您可以按站点地图过滤“视频网页索引编制”报告,以查看此站点地图中有多少网页网址包含已编入索引的视频。请注意,Search Console 会指出网页上是否有与站点地图中的指定视频网址不同的视频网址已编入索引。如果 Google 进行抓取时,此处列出的站点地图中有任何已编入索引的网页含有任何视频,该站点地图就会链接到“视频网页索引编制”报告。
- 查看索引涵盖范围
- 点击即可打开一个报告,其中会显示该站点地图中所有网址的索引覆盖范围。对于站点地图索引,其中包含子站点地图中列出的已被抓取的所有网址。
我的站点地图未列出!
如果您的站点地图未在此报告中列出,可能是以下几种原因造成的:
- 站点地图位于另一项资源中。与一项资源关联的站点地图不会在另一项资源的报告中显示。因此,您已为网站
http://example.com
提交的站点地图不会显示在http://m.example.com
或https://example.com
的“站点地图”报告中。若要解决此问题,请确保您已添加相应网站的所有版本。 - 您提交站点地图时未使用此报告或 Sitemaps API。此报告只会列出使用此报告或 Search Console Sitemaps API 提交的站点地图;系统不会显示通过其他方法找到或提交的站点地图,即使 Google 能找到和使用这些站点地图。
站点地图错误
“站点地图”报告可报告下列错误。此列表并不完整,但足够长,能够涵盖您可能会看到的大多数错误。
- 站点地图已被您的 robots.txt 文件屏蔽。Google 在抓取站点地图时会遵循 robots.txt。您必须移除阻止 Google 抓取站点地图的规则。
- 您的网站受到人工处置措施。如果网站有未解除的人工处置措施,系统不会读取站点地图。查看“人工处置措施”报告。请解决相应问题,然后重新发送站点地图。
- 为站点地图提供的网址有误(HTTP 404 错误:在提供的地址中找不到站点地图)。请尝试在浏览器中访问该网址,看看该网址是否存在。
- 一些其他常规错误:有时,其他错误可能会导致 Google 无法从您的网站检索站点地图,例如服务器不可用。其中一些错误可能是暂时性的:请稍等片刻,看看 Google 在后续的抓取尝试中是否仍会遇到此错误。
- 站点地图的抓取需求较低。网站内容的质量越高,抓取需求就越高。详细了解如何创作优质内容。
调试抓取错误
处理已抓取的站点地图时可能会出现以下错误:
网址无法访问
Google 在尝试抓取站点地图中的网址时遇到了错误。请使用网址检查工具检查站点地图中的网址,查看该网址是否可供 Google 访问。
网址无法追踪
Google 无法抓取站点地图中列出的所有网址。以下是一些可能的原因:
- 网址包含过多重定向,以至于 Google 网页抓取工具无法追踪。我们建议您将站点地图中的所有重定向网址替换成应实际抓取的网址。
- 如果您要将一个网页永久地重定向到另一个网页,请使用永久重定向。
- 避免使用 JavaScript 或元刷新类型的重定向。
- Google 无法追踪站点地图中的相对网址。尽可能使用绝对链接或完整链接,避免使用相对链接。例如,当您需要链接到网站上的另一网页时,请链接到
https://www.example.com/mypage.html
,而不是仅链接到mypage.html
。
不允许的网址
您的站点地图包含的某些网址所处的网域级别比站点地图文件更高或与其不同。
更高级别:如果站点地图位于 http://www.example.com/mysite/sitemap.xml
,则该站点地图的以下网址将无效:
http://www.example.com/
- 级别高于站点地图http://www.example.com/yoursite/
- 与站点地图处于同级目录中(必须前往上层目录,然后再向下返回此网址所在的目录,才能获取此网址)。
不同网域:检查并确保所有网址开头的网域都与站点地图所在的网域相同。例如,如果站点地图位于 http://www.example.com/sitemap.xml
,该站点地图的以下网址将无效:
http://example.com/
- 缺少“www”www.example.com/
- 缺少“http”https://www.example.com/
- 使用的是 https 而非 http
压缩错误
Google 在尝试解压缩经过压缩的站点地图文件时遇到了错误。请重新压缩站点地图(使用 gzip 等工具),然后将其上传到您的网站,再重新提交。
空站点地图
站点地图不包含任何网址。请检查站点地图,确保内容不为空。
站点地图文件大小错误:站点地图已超出文件大小的上限。
站点地图未压缩时的大小超过了 50MB。如果站点地图大小超出此上限,请将其分成几个较小的站点地图并列在站点地图索引文件中,然后再提交站点地图索引文件。
属性值无效
您为 XML 标记属性分配了无效值。请检查站点地图,以确保仅存在允许的属性,且您分配的所有值都符合站点地图规范。另外,还要检查属性和值有无拼写错误。
日期无效
站点地图包含一个或多个无效日期。发生这种错误的原因可能是日期格式不正确或日期本身无效。日期必须使用 W3C 日期时间编码(您可以省略时间部分)。确保日期符合以下其中一种 W3C 日期时间格式:
2005-02-21 2005-02-21T18:00:15+00:00
您可以选择是否指定时间(时间会默认为 00:00:00Z),但如果指定了时间,还必须要指定时区。
标记值无效
您的站点地图中有一个或多个标记的值无效。请查看与您的站点地图类型(索引、标准、视频等等)对应的规范。
网址无效
站点地图中的某个网址无效。出现此错误的原因可能是该网址包含不支持的字符、空格或诸如引号之类的其他字符,也可能是该网址的格式不正确(例如,您输入的是 htp://
而不是 http://
)。
请确保站点地图中列出的网址已编码成可读取的格式并已正确转义。请检查网址中是否存在空格或引号之类的错误字符。您也可以将网址复制到浏览器,看看浏览器是否能识别该网址并加载网页。
站点地图索引文件中的网址无效:网址不完整
站点地图索引文件没有为其列出的每个站点地图文件提供完整的网址。当我们发现站点地图索引文件时,会在同一目录下查找其引用的文件。例如,如果您的站点地图索引文件为 http://www.example.com/folder1/sitemap_index.xml
,并且您将站点地图列为 sitemap.xml
(开头没有 /
),那么我们会在 http://www.example.com/folder1/sitemap.xml
查找该站点地图。如果我们在此路径下找不到该站点地图,系统就会显示此错误。
请更新站点地图索引文件,纳入指向各个所列站点地图文件的完整路径,然后重新提交。
XML 无效:标记过多
站点地图包含重复的标记。例如,以下条目会导致此错误,原因是 <loc> 标记出现了两次:
<url> <loc>http://www.example.com/</loc> <loc>http://www.example.com/page1.html</loc> <lastmod>2005-01-01</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority> </url>
错误消息中会列出存在问题的标记及其所在的行号。请移除重复的标记,然后重新提交您的站点地图。
缺少 XML 属性
站点地图中的某个标记缺少必要的属性。请检查站点地图,确保没有缺少必要的属性。修正属性值后,请重新提交站点地图。缺少 XML 标记
站点地图中的一个或多个条目缺少必要的标记。错误消息中会列出行号。请参阅站点地图基础信息页面,了解必要标记的相关信息。
缺少缩略图网址
一个或多个视频条目缺少指向缩略图的网址。请务必使用 <video:thumbnail_loc> 标记指定所有缩略图网址的位置。
缺少视频标题
一个或多个视频条目缺少标题。请确保站点地图中的每个视频都具有以 <video:title> 标记指定的标题。
站点地图索引文件格式不正确:嵌套的站点地图索引
您的站点地图索引文件中的一个或多个条目使用了该站点地图索引文件自身的网址或其他站点地图索引文件的网址。站点地图索引文件只能列出站点地图文件,而不能列出其他站点地图索引文件。
请移除任何指向站点地图索引文件的条目,然后重新提交站点地图。解析错误
Google 无法解析站点地图的 XML。
此问题通常是由网址中的未转义字符引起的。和所有 XML 文件一样,对于某些字符(例如 &、'、"、<、> 符号),任何数据值(包括网址)都必须使用实体转义代码。请确保您的网址已正确转义。
暂时性错误
我们的系统遇到了临时问题,因此无法处理您的站点地图。一般情况下,您在遇到此错误时无需重新提交站点地图。Google 稍后会再次尝试检索您的站点地图。如果几个小时后此错误仍然存在,您不妨尝试重新提交站点地图。
站点地图文件太多
您的站点地图索引文件中列出的站点地图超过了 50,000 个。请将您的站点地图索引拆分成多个站点地图索引文件,并确保每个文件中列出的站点地图不超过 50,000 个。
网址太多
您的站点地图列出的网址超过了 50,000 个。请将您的站点地图拆分成多个站点地图,并确保每个站点地图包含的网址不超过 50,000 个。您也可以使用站点地图索引文件管理站点地图。
格式不受支持
站点地图所采用的格式不受支持。
一些常见 XML 错误包括:
- 站点地图必须使用正确的标头。例如,如果站点地图包含视频信息,则会具有以下标头:
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">
- 标头中的命名空间必须为 "http://www.sitemaps.org/schemas/sitemap/0.9"(而非 .9)。
- 所有 XML 属性必须括在单引号 (') 或双引号 (") 中,并且必须是半角引号,而不是全角引号。Microsoft Word 之类的文字处理程序可能会插入全角引号。
路径不匹配:缺少 www
站点地图的路径不包含 www
前缀(例如 http://example.com/sitemap.xml
),而其中列出的网址却包含该前缀(例如 http://www.example.com/myfile.html
)。
您可以修改站点地图,移除所有网址中的“www”,使其与站点地图的位置相匹配。
路径不匹配:包含 www
站点地图的路径包含 www
前缀(例如 http://www.example.com/sitemap.xml
),而其中列出的网址却不包含该前缀(例如 http://example.com/myfile.xml
)。
您可以修改站点地图,在所有网址中添加“www”,使其与站点地图的位置相匹配。
命名空间不正确
您站点地图的根元素未包含正确的命名空间,或者命名空间未正确声明、存在拼写错误或网址不正确。
请务必根据您的文件类型使用正确的命名空间。例如:
- 站点地图文件:
xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
- 视频 Sitemap 文件:
xmlns:video="http://www.google.com/schemas/sitemap-video/1.1"
- 站点地图索引文件:
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
- 其他站点地图类型…
开头为空格
站点地图以空格(而非命名空间声明)开头。XML 文件的开头应该是指定所用 XML 版本的 XML 声明。
虽然此错误不会影响 Google 处理站点地图,但您最好移除开头的空格,使该文件符合 XML 标准,同时避免系统再次显示此错误。
HTTP 错误 [具体代码]
Google 尝试下载站点地图时遇到了 400 级别的 HTTP 错误。此错误消息会显示我们收到的状态代码(例如 404)。请确保您指定的站点地图网址是正确的,并且相关站点地图位于该网址上。然后,重新提交您的站点地图。
常见 HTTP 错误
Google 又遇到了一个 HTTP 错误,但此错误未被这里列出的更具体错误涵盖。展开详细信息可查看发生了哪种错误。这种情况也可能是由 404(网页不存在)错误导致,404 错误是一种抓取错误。
缩略图过大
站点地图中指定的视频缩略图过大。请将视频缩略图的尺寸调整至 160x120 像素。使用新信息更新站点地图,然后重新提交。详细了解如何向站点地图添加视频信息。
缩略图过小
站点地图中指定的视频缩略图过小。请将视频缩略图的尺寸调整至 160x120 像素。如有必要,请更新站点地图。详细了解如何向站点地图添加视频信息。
视频位置和播放页面位置相同
在视频站点地图中,视频内容网址和播放器网址不能相同。如果您同时提供 <video:player_loc>
和 <video:content_loc>
,则必须提供两个不同的网址。详细了解如何向站点地图添加视频信息。
视频位置网址似乎是播放页面网址
在视频站点地图中,<video:content_loc>
网址指向托管播放器的页面。详细了解如何向站点地图添加视频信息。
新闻网址过多
站点地图文件中打开的网址的数量超过系统规定的数量上限(1,000 个网址)。详细了解如何向站点地图添加新闻信息。
缺少 <publication>
标记
新闻站点地图中的每个网址都必须有一个 <publication>
标记。详细了解如何向站点地图添加新闻信息。
站点地图包含遭到 robots.txt 屏蔽的网址
由于遭到 robots.txt 文件的屏蔽,Google 无法访问您的站点地图,也无法访问站点地图中列出的所有内容。请使用网址检查工具确认是哪个文件遭到了屏蔽,然后修改 robots.txt 文件以允许 Googlebot 访问该站点地图文件。