Search Console / sitemap / 收录

Search Console 提交 sitemap 后显示无法抓取时怎么判断

先用公开访问和 Googlebot 模拟确认 sitemap,再判断是站点问题还是 Search Console 延迟。

发布:2026-06-21 · 更新:2026-06-25

先看线上状态

访问 https://1984119.xyz/sitemap.xml,如果返回 200、内容以 XML 开头、包含 loc 标签,说明文件本身存在。还应确认 robots.txt 中声明了 sitemap。

再看内容类型

sitemap 的 Content-Type 最好是 application/xml 或 text/xml。Cloudflare Pages 会根据扩展名返回 application/xml,这对搜索引擎读取是正常的。

模拟 Googlebot

如果普通访问和 Googlebot User-Agent 访问都返回 200,说明 Cloudflare 或站点没有阻止抓取。Search Console 初次提交后显示无法抓取,有时只是延迟。

提交格式

如果当前资源是域名资源,可以提交完整 URL;如果是网址前缀资源,通常提交 sitemap.xml 也可以。遇到提示地址无效时,直接提交完整地址更稳妥。

不要反复提交

短时间多次删除和提交 sitemap 不会加快收录。确认文件可访问后,等待系统重新读取更有效。

常见问题

无法抓取一定是网站坏了吗?

不一定。Search Console 报告有延迟,必须结合线上 HTTP 状态判断。

可以提交 sitemap.txt 吗?

可以作为备用,但 XML sitemap 更适合包含 hreflang 等信息。

相关记录

全部记录