如何修复站点映射错误 : 共同问题和最佳做法,斯维特兰娜在SE Ranking领导内容团队. 她的内容营销专门知识由于对SEO过程的深刻理解而得到加强.
SE Ranking的SEO专家. Olena在市场研究、网站绩效改进、调查和解决技术性的机会均等问题方面具有专门知识
总结此博客文章:
所以,你刚刚创建了一个网站地图,并将其提交给了Google,但你的网站地图状况并没有显示“成功”。 ** 或许你的Sitemat报告看起来不错, 但在检查了 QQPage Indexing #_report后, 现在,你想知道,你是否可以做点什么来改进你的索引统计。
请勿再细看,
如果您没有站点图, 想要学习如何制作闪亮的站点图, 请使用我们的__ 介绍站点映射崩溃课程_ _ 。 它涵盖一个站点地图的好处,并介绍了几个站点地图最佳做法。 您需要查询一个指南, 特别是您不知道“ loc” 和“ lastmod” 标签是用于什么, 或者您仍然不熟悉视频网站地图或网站地图索引文件。 _
此帖首部分列出您在 GSC Sitemat 报告中可能遇到的所有潜在错误 。 若您正在解决具体问题,
这篇文章的下半部分, 它涵盖:
- 如何在您的网站地图中找到垃圾页 。
- 在您的网站地图文件中查找缺失的页面。
*如何鼓励Google为您网站地图的更多页面进行索引.
请仔细研究这篇文章的第二章。 并提升网站在Google的知名度。
_该员额的所有建议截至2025年11月。 _ 编号
SE Ranking的新AI概览研究
下载以了解AIO在推出后如何改变,
你们都准备好了!
点击我们在电子邮件中发送的链接确认您的电子邮件
并获得由SE Ranking撰写的AI概览研究
- 在向Google提交您的 XML 网站地图后,您可能获得“成功”状态。 这意味着Google成功获取,没有发现错误. 其他状况表明需要解决的问题。
- 使用 URL 检查工具来诊断妨碍 Google 获取您网站地图文件的问题.
- 要在使用网站地图索引文件时访问您的网站 URL, Google 必须成功处理所有列出的网站地图 。 避免错误,方法是确保所有引用的站点映射URL完全合格,不包括嵌入索引文件,并且将站点映射的数量保持在每个文件5万以下.
页:1 为了避免Stimeap文件大小错误,在未压缩时将您的文件保持在50MB以下,并限制在5万个位置的URL(不计替代语言版本). 您可以压缩 sitemaps 来保存带宽, 请确保您的 sitemap 并不是空的, 并且可以避免重复的 URL 给文件大小添加不必要的批量 。
- Google可能无法在您的站点地图中爬行URL,原因有几个: 机器人中屏蔽URL. txt, URL 无法访问, URL 未遵循, URL 不允许 。 使用SE Ranking的网站审计工具来监测这些问题是理想的,因为它有一个专门处理网站地图错误的章节.
- 从您的站点地图中不包括低质页面:内容薄和软度404(显示“200 OK”而不是适当的错误状态)。 使用谷歌分析参与度量衡和Page索引报告来识别这些问题.
*在手动创建站点映射时,注意语法错误:使用正确的站点映射协议,有效的标记和属性值,适当的URL和日期格式,包括强制标记(urlset, url, loc, xmlns),并为您的站点映射类型(新闻,视频,图像,hreflang)使用正确的命名空间协议.
- 请检查页面索引报告, 以了解Google的哪些网页索引, 确保您不会用错误的机器人指令或犬类标记发出混合信号。 相反,向Google提供您想要它索引的页面的明确信号.
修正子项目报告错误
在向 Google 提交您的站点映射后, 您可以看到它是否成功处理状态列中的文件 。 如果您的文件符合所有规则, 它的状态应该是 {Success} 。
我们将讨论另外两个状态代码,
下潜前速记:** 我们最近推出了新的网站审计2.0,其中包含一个新的Sitemap部分。 现在所有与站点映像有关的检查都是在一个地方组织的,这样可以更容易地发现和解决以前分散在不同类别的问题(比如在机器人中找不到的QQML站点映像). txt file_,3XX在XML sitemap中重定向,在XML sitemap中非目录页面,在XML sitemap中无索引页面,在XML sitemap中为4XX页,在XML sitemap中为5XX页. 我们还调整了关键网站地图问题的优先级别,以更好地反映其对网站业绩的影响。 QQML sitemap 等关键问题太大 并且_ XML sitemap_ 中的非目录页面现在标记为错误 。 一期_3XX在站点地图中重定向_已经从通知升级为警告. 截至2025年11月,这些变化是准确的。
** Google 很难爬行您的网站地图文件* 页:1
让我们从最困难的情景开始: Google 无法获取您的网站地图文件 。 发生这种情况时,需要使用URL检查工具来找到问题的根源.
在 _URL 检查工具 _ 中,单击 Live _ test_按钮并检查页面获取状态. 如果上面写着“成功”, 如果发生这种情况, 考虑联系 Google 支持 。
在联系Google的支援团队并报告问题时,向他们提供相关细节,包括网站地图的URL,遇到的任何错误信息,或所做的观察. 谷歌将提供分步指导,帮助您解决问题.
如果谷歌的一端没有错误, 且您的站点地图无法获取, 有时机器人.txt指令,甚至CMS插件都要责备. 并注意协议和www.
这些技术既可以应用于单一和站点映像索引文件. 现在,让我们研究解决最常见的XML网站地图问题。
** 对象索引文件错误**
Google 在获取您提交的文件时, 偶尔可能会发现 XML 网站映射错误 。
当使用网站映射索引文件访问您网站的URL时, Google 必须处理其中列出的所有单独的网站映射. 如果Google未能处理网站映射索引文件中列出的URL,则您可能在网站映射索引文件中收到无效的URL错误. 这通常意味着不完整的URL或打字功能正在阻止Google找到你的一个或多个网站地图. Google 找不到您的 URL, 除非您网站映射索引文件中的所有单个站点映射都完全合格 。
您的站点映射索引文件也不应该列出其他站点映射索引文件, 只列出站点映射 。 但如果你决定列出它们, 你会得到一个 ** 不正确的站点地图索引格式: Nested站点地图索引** 错误。
网站地图索引文件中有许多网站地图。 当大型网站在一个文件中列出超过5万个网站地图时,就可能出现这种情况.
QQ 对象大小和压缩错误
大小限制既适用于站点地图索引文件,也适用于单个站点地图. 未压缩时, spitalap 文件大小不应超过50 MB 。 文件也不应该列出超过5万个位置的URL(不计另类). 如果您无法遵守这些建议, 您将会收到 itemap 文件大小 错误 。 截至2025年11月,这些限制在Google的官方网站地图协议中保持不变.
阅读我们最终的站点地图指南,学习如何将站点地图分割成几个站点地图文件.
Google在您网站地图中包含本地版网页时, 如何计算URL, Google的John Mueller认为, 这意味着,即使一个页面的不同语言版本有多个xhtml:link位置,在站点映射尺寸限制方面,也会算作一个URL.
另外一件事你应该知道的是,Google数 重复 QQ loc>_ URL作为网站映射中的一个. Google可能不认为这是站点映射错误,但你还是应该保持站点映射的清洁,避免重复. 重复不会有什么帮助 Google 更快地索引您的网站, 而可以添加拼凑, 并增加网站地图 XML 文件的大小 。
虽然你的网站图不应该是巨大的, 提交Empty sitemap将导致错误。
另外,在本文的早些时候,我们提到网站地图的尺寸在未压缩时应该小于50 MB,但压缩网站地图以节省带宽是常见的做法. 用于此目的的一个常用工具是gzip,它将gz扩展添加到sitemaps中. 如果您在GSC报告中得到压缩站点映射错误,这意味着压缩过程中发生了一些错误. 你最好再试一次
** Google 无法爬行您网站地图的 URL **
Google可能无法爬行您网站地图上列出的 URL 有几个原因. 让我们看看一些最常见的。
- **Sitemap包含被机器人封锁的URL. 页:1 这 站点映射错误是一个相当明显的错误, 特别是因为GSC会指向每个被封锁的 URL 。 取决于您是否想要对这些 URL 进行索引, 您需要将 URL 或 解除 。
其他网站地图报告错误,如URL不可用,URL不遵循,和URL不允许不是那么明显. 让我们简短地逐一看看。
- ** URL 无法访问** 错误意味着 Google 在指定地点找到了您的网站地图, 但无法获取您列表中的一些 URL 。 发生这种情况时,使用URL检查工具. 当Google无法获取您的网站地图时,
- 未遵循的 URLs 错误要么是因为您在您的站点地图上使用了相对的URL而不是完全合格的URL,要么是因为重定向问题. 一些能够导致这些错误的活动包括重定向链和循环,临时重定向而不是永久重定向,以及HTML和JS重定向.
尝试不要在 XML 站点地图中持续重定向 URL 超过需要的时间 。
虽然将重定向的URL纳入站点地图对于某些情景可能是有用的策略,但效果有限. 定期审查并更新您的 XML 网站地图,以确保它包括相关的和当前的 URL 。
谷歌搜索 控制台不会说明问题的确切原因, 例如,SE Ranking的站点审计有一个专门的Redictions部分,帮助您检查您的网站是否有重定向问题.
如果工具发现问题, 您可以访问每个站点映射错误中的所有关键信息 。 点击显示有多少页受到影响的号码即可 。 这将确保您知道哪个页面存在错误以及如何与网站的其他页面链接。
- 不允许** URL ** 错误表示您的站点映射在更高级别或不同的域上具有URL功能,而非站点映射文件本身. 例如,如果您的站点地图位于_yoursite.com/cetrole1/siteap.xml_,您在站点上添加了一个页面。 相机/页1, 谷歌无法访问该页面.
说到不同的领域,要谨慎,因为Google将HTTP和HTTP以及您的网站的www和非www版本视为不同的实体。 如果您最近切换到其中任何一个, 请确保生成一个新的站点图 。
SE Ranking的_Website Audit_工具也会提醒您,
最后,还有一件事可以阻止 Google from crawing a page - a HTTP 非200状态代码. 该错误在GSC报告中被标记为HTTP错误,每个实例都指定了准确的站点映射错误代码. 您可以在 SE Ranking 的_网易审计_Siteap 部分找到所有关键信息。
Google 怀疑您列出错误的 URL
在管理您的网站地图时, 请不要包含薄内容或软404页, 因为它会对您网站的SEO产生消极影响 。 因此:
- Thin内容是指提供有限内容或重复内容,为用户提供很少价值的页面. 为了解决这一问题,进行人工审查和数据分析,以查明缺乏实质内容或质量的网页。 例如,您可以使用Google Analytics来抽查接触率低且流量最小的页面,因为它们可能是内容薄的候选人. 一旦识别出来,你有三个选项:没有索引这些页面,通过内容重修来提高它们的质量,或者从你的网站上完全删除它们.
- 软件404页** 返回“200 OK”状态代码,而不是“404未找到”状态,误导搜索引擎和用户。 为识别这些页面,请访问Google搜索控制台的Page索引报告,其中软404页将列在没有Google索引的页面中. 仔细审查这些网页,然后采取适当行动。 如果页面真的不存在, 请设置正确的404 或 410 错误状态以表示其缺失 。 另一方面,如果网页确实存在,并且您希望Google将其索引,则关注于提升其内容,然后重新进行索引.
QQ 基于语法的站点映射错误
您通常不需要担心基于语法的 sitemap 错误, 如果您生成一个 sitemap , 并使用一个特殊的工具来正确处理标签和属性 。 另一方面,即使您手动创建了您的网站地图,您也可能遇到以下问题之一:
页:1 您的 URlset 标签中列出的命名空间应该是被接受的协议之一 。 目前,使用下列协议:
•
视频网站地图 #xmlns:video=” #=
- 如果您在您的站点地图中使用了错误的协议, 您将会得到 不支持的格式 错误 。 这种错误也可能由于各种语法错误而发生,例如使用不正确的引号(只接受直单引号或双引号)或缺少编码标记.
也有多个视频-siteap特定错误: ** Thumbnail 太大/小,视频位置和播放页面位置相同,视频位置 URL 似乎是一个播放页面 URL。 ** 在此查找这些错误的更多细节 。
为了保证您的 XML 站点映射准确且结构合理, 您必须知道如何防止语法错误和常见站点映射错误 。 实现这一目的最方便的方法之一是使用XML网站映射验证器,比如这个. 这些工具将产生一份全面的报告,突出有问题的章节或代码线,并就如何纠正共同的站点地图错误提供宝贵的见解。
一旦您修复了您全球供应链报告中提及的所有站点映射错误, 请重新提交您更新的站点映射, 并附上新的请求 。 在 Google 搜索控制台中打开 Stimeaps 报告, 将您的站点映射 URL 添加到添加一个新的站点映射框中, 并单击提交 。 对于小更新,让Google遵循它的正常爬行时间表.
为了解网站索引的出入,阅读此完整指南.
** 平衡提交的 URLs 相对于索引 URLs 比率**
即使你的网站地图或网站地图索引文件状况表示“成功”,这并不意味着你的工作已经完成。 点击 _ See Page Indexing_ 键, 在发现的 URL 数旁边键, 以进入相应的报表 。 您可能开始调查, 只是为了发现您提交的页面并非全部被索引 。
在监控Google搜索控制台中您网站页面的索引状态时,您可以使用网站映射过滤功能,这使得网站映射和页面类别之间的切换变得容易.
要访问此功能,请浏览Google搜索控制台中的页面索引报告,选择Sitemap过滤器,然后选择要检查的类别或站点映射. 您可以在此查看以下报告:
- ** 所有已知页数**: 包括谷歌发现的所有页面.
- ** 提交页**: 列出通过您的网站地图提交的页面。
- ** 未提交页**:强调谷歌已经找到但并未通过您的站点地图提交的页面。
将页面排除在索引之外, 这是因为Google无法欣赏和索引您网站上的所有页面。 许多网站都有网页,
如果Google没有为您的页面编制索引,那很可能是因为您添加了不该放在您的网站地图上的页面。 Google可能因为一个无索引指令而无法索引和爬行页面,或者Google可能无法确定是否想要该页面索引,比如当您在您的网站地图中添加非目录页面时. 每个实例都可以在GSC_Page Indexing_ report的不同标签中找到,但使用SE Ranking的_Website Audit_工具来检查它们更为方便,该工具将在_Issue report的_Siteap_章节中显示任何爬行问题. _ 编号
要解决非索引页面问题, 请从您的网站地图中删除无索引和非目录页面 。 或者,如果这些页面被误标为无索引和无目录,则纠正错误的标签问题,以便能够进行适当的索引。
一旦您确定您的网站地图不会向Google发送混乱的信号, 请通过_ Page Index_ 报告,
- 在Indexed tab中,你可以发现Google成功爬行和索引的页面. 要访问此列表,请在报告摘要页的图表下点击_查看有关索引页的数据_。 这份报告只列出1000个URL,因此并非所有的页面都可以包含. 对于特定URL上的更详细数据,请从列表中选择,或将其添加到页面顶端的搜索栏中,并点击“检查URL”按钮. 这将提供更多关于谷歌如何看待和处理该URL的见解。
在页面的底部, 您可以找到“ Improve page expect_ ” 部分, 其中列出索引页面, 密切注意虽有无索引指令却仍编制索引的网页。 在这种情况下,Google的判断可能是准确的,您应当考虑从这些页面中删除无索引标记,或者审查您的X-Robots标记设置. 您可能想要将这些页面添加到您的网站地图中, 因为Google认为这些页面的质量很高. 您还应注意在您的网站地图上已索引但未显示的重复页面 。 这一般是由于pagination和参数处理不当所致.
包括出现索引错误或有意排斥等原因。 这可能显示为被机器人.txt屏蔽的页面,旧的404页,或者没有索引或目录标记的页面.
URL没有被索引的原因在_为什么页面没有索引_表格中列出. 它显示受影响页面的状况、来源和数量。 花时间彻底审查每个案件。 特别注意谷歌选择不索引的canonical页面,因为搜索引擎可能认为你的网站上有更好的替代品. 如果Google的评估正确,请考虑修补你的犬科标签. 如果你仍然认为该页面应该被索引,专注于改善其内容,回路配置,以及内部链接,以说服Google,它比其他选项更有价值.
解决问题后,可以点击问题报告中提供的按钮,向Google通报并请求验证固定.
或为Google提供其索引中不需要的网页更清晰的信号。
结论
纠正网站地图错误是有效的网站爬行和索引战略的关键部分。 我们希望这个指南能帮助您修复您报告中常见的 XML 网站映射错误 。 另一个需要记住的重要方面是,你的网站地图只应包括您想要Google索引的页面. 我们建议只保留多汁,高质量的网页 在您的网站地图上,同时删除所有可能给搜索引擎带来不良印象的网页。 如果你还有其他问题, 请不要犹豫,
Svitlana是SE Ranking公司的内容团队领跑者,她在此指导内容策略,并确保团队的输出达到标点. 她偶尔在SE Ranking博客上分享她的见解。 除了工作之外,斯维特兰娜还忙着让她的小孩活着和微笑. 她也是文学、艺术和旅行的粉丝。