站点出现抓取异常、无法被抓取、返回码设置错误、死链接过多、无效页面、重定向过多等,直接影响搜索引擎对网站抓取出现异常。将直接导致搜索引擎会认为网站存在用户体验上的缺陷,并降低对网站的评价,在抓取、索引、权重上都会受到一定程度的负面影响,最终影响到网站从百度获取的流量。
以下信息来源百度站长帮助中心
什么是抓取异常?
对于互联网中可正常访问的内容,百度spider抓取的结果应与普通用户访问的内容是一致的,除此以外的情况,就是抓取异常。
有那些抓取异常影响:
1.什么是死链? 具体请参考:网站死链接(称:无效链接)
页面已经无效,无法对用户提供任何有价值信息的页面就是死链接,包括协议死链和内容死链两种形式。
协议死链:页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如404、403、503状态等。
内容死链:服务器返回状态是正常的,但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面。
对于死链,建议通过百度站长平台--死链工具提交死链的方式进行处理,以便搜索引擎更快地发现死链,减少死链对用户以及搜索引擎造成的负面影响。
2.什么是IP禁封?
限制网络的出口IP地址,禁止该IP段的使用者进行内容访问,即为IP禁封。
3.什么是UA禁封?
UA即为用户代理(User-Agent),服务器通过UA识别访问者的身份。当网站针对指定UA的访问,返回异常页面(如403,500)或跳转到其他页面的情况,即为UA禁封。
3.什么是异常重定向?
将网络请求重新指向其他位置即为重定向。异常重定向指的是以下几种情况
当前该页面为无效页面(内容已删除、死链等),直接跳转到前一目录或者首页,百度建议站长将该无效页面的入口超链接删除掉
重定向到出错或者无效页面
重定向的跳转超过3次,也为异常
注意:对于长时间跳转到其他域名的情况,如网站更换域名,百度建议使用301跳转协议进行设置。
4.还有哪些其他异常?
针对百度refer的异常:网页针对来自百度的refer返回不同于正常内容的行为。
针对百度ua的异常:网页对百度UA返回不同于页面原内容的行为。
JS跳转异常:网页加载了百度无法识别的JS跳转代码,使得用户通过搜索结果进入页面后发生了跳转的情况。
压力过大引起的偶然封禁:百度会根据站点的规模,访问量等信息,自动设定一个合理的抓取压力。但是在异常情况下,如压力控制失常时,服务器会根据自身负荷进行保护性的偶然封禁。这种情况下,请在返回码中返回503(其含义是“Service Unavailable”),这样百度spider会过段时间再来尝试抓取这个链接,如果网站已空闲,则会被成功抓取。
抓取异常对网站的影响有哪些?
对于大量内容无法正常抓取的网站,搜索引擎会认为网站存在用户体验上的缺陷,并降低对网站的评价,在抓取、索引、权重上都会受到一定程度的负面影响,最终影响到网站从百度获取的流量。
文章来源:公众号SEO实战营(ID:ilottecn),原文链接:https://mp.weixin.qq.com/s/mxOYXPuNciA-RVPzacovPQ
本网站所收集的部分公开资料来源于互联网,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
本网站所提供的信息,只供参考之用。本网站不保证信息的准确性、有效性、及时性和完整性。本网站及其雇员一概毋须以任何方式就任何信息传递或传送的失误、不准确或错误,对用户或任何其他人士负任何直接或间接责任。在法律允许的范围内,本网站在此声明,不承担用户或任何人士就使用或未能使用本网站所提供的信息或任何链接所引致的任何直接、间接、附带、从属、特殊、惩罚性或惩戒性的损害赔偿。