2012-07-18
611
0
甘肃网络公司网管工具的错误分为两类:网站错误网站错误,链接错误(URL错误)。在网站上抓取错误,那么你的网站的信任度下降,甚至会影响排名,当然,这个工具是百度优化同样有效。应该如何解决谷歌网站管理员工具的抓取错误。
由Googlebot抓取误判知道是什么引起的抓取错误。
首先,HTTP错误
到您的服务器上的网站(例如,当用户访问你的页面在浏览器或当Googlebot抓取的页面)页面发出请求,服务器返回的HTTP状态码响应请求。
如果403状态,你不能忽视,建议,以防止Googlebot的爬行你的主机。 HTTP状态代码文件列表,你可以参考的HTTP状态代码的帮助页面。
其次,错误的地图
Sitemap错误往往会导致404错误页面返回一个404错误页面,或者当前的地图,如果在所有的404错误页面的链接,请检查地图
谷歌将继续抓取您有删除地图,这是非常令人沮丧的,但也有一个解决方案:确保在管理员工具的旧地图。如果你不希望被抓取,以确保老地图404或重定向到新的地图。
从谷歌员工苏珊Moskwa的解释:
防止来自Googlebot的爬行,最好的办法是使这些URL(例如,旧的Sitemaps)404,当我们看到一个URL 404多次,Googlebot会停止爬行。
第三,重定向错误
有些错误是301方向,并执行重定向注意哪些:
1,以确保它们返回正确的HTTP状态代码。
2:确保没有循环重定向。
3:确保您重定向指向有效的网页,而不是404,或其他错误页面,如503(服务器错误)或403(禁止抓取)
4:确保重定向不指向一个空页。
第四,404
404错误,可能会发生在以下几个方面:
1:删除网站上的网页;
2:改变页面的名称;
4:链接的页面不存在;
5:其他网站链接到您网站上的页面不存在;
6:网站迁移到一个新的域名不完全匹配的网站。
第五,受robots.txt限制
另一个原因是,robots.txt文件来阻止Googlebot抓取,如果有大量的抓取错误,第一步应该是检查的robots.txt
,软404
正常情况下,当有人请求的页面不存在,服务器将返回一个404(未找到)错误。响应请求的页面不存在返回404代码,服务器也将显示404。这可能是一个标准的“未找到文件”消息,或旨在提供更多有关用户的信息,它可能是一个自定义页面。网页的内容是由服务器返回的HTTP响应完全无关。 404文件未找到消息并不意味着它是仅仅因为一个404页。
七,加班
网站超时是抓取错误的原因之一,如果有超时现象,Googlebot以停止爬行。超时错误类型是:
1:DNS超时,您可以使用nslookup命令来检测DNS,有DNS超时的最大因素是域名服务提供商的DNS服务器不稳定。
2:在一个特定的页面的网址超时,而不是整个域的错误。
3:一个robots.txt超时,如果您的网站有一个robots.txt,但服务器超时,Googlebot会认为该文件不存在。
4:动态网页的响应时间太长,导致页面加载时间过长。
“抓取错误”是 Google网站管理员工具(Webmaster Tools)中最受欢迎的工具之一。它可以帮助你检查错误的链接,不仅仅是URL链接,还包行DNS解析失败、服务器链接、robots.txt 文件等问题,几乎所有网站都会出现抓取错误。
网站站长工具将错误分为两类:网站错误(site errors)和链接地址错误(URL errors)。如果在一个网站上出现多个抓取错误,那么你的网站信任度会下降,甚至会影响到排名,当然这工具对于百度优化同样有效。那么应当如何解决 Google网站管理员工具的抓取错误呢。