资讯中心
News
503状态码与404的区别
发布时间:2022-09-27 00:00   您所在的位置: 网站首页 > 新闻资讯 > 经验杂谈

Html状态码也是网站与spider开展交流的渠道之一,会告知spider网页现在的状态,spider再来确定下一步该怎么做——抓or不抓or下次再来讲看。相对200状态码大伙已经很熟了,那么咋们来介绍几种常见的失效网页使用的状态码:
【404】404返回码的含义是“NOTFOUND”,百度会认为网页已经失效,那么通常会从搜索结果中删除,并且短期内spider再次发现这条url也不可能抓取。
【503】503返回码的含义是“ServiceUnavailable”,百度会认为该网页临时不可浏览,通常网站临时关闭,带宽有限等会产生这种情况。相对网页返回503,百度spider不可能把这条url直接删除,短期内会再浏览。届时假如网页已恢复,则正常抓取;假如继续返回503,短期内还会反复浏览几次。不过假如网页长期返回503,那么这样的url仍会被百度认为是失效链接,从搜索结果中删除。
【301】301返回码的含义是“MovedPermanently”,百度会认为网页当前跳转至新url。当遇到站点迁移,域名改换、站点改版的情况时,推荐使用301返回码,尽量减少改版提供的流量损失。虽然百度spider现在对301跳转的响应周期较长,但咋们还是推荐大伙这么做。

一部分网站把未建好的页面放到线上,并且这些页面在被百度抓取的时候返回码是404,于是页面被百度抓取后会被当成死链直接删除。不过这样的页面在第二天或者过几天就会建好,并上线到网站内展现出来,不过由于以前已经被百度当做死链删除,故此要再次等这些链接被发现,然后抓取才能展现,这样子的操作较终会使得一部分页面在一段時间内不可能在百度出现。比如某个大型门户网站爆出大批新闻时效性很强的专题未被百度及时收录的问题,经检查验证后发现便是由于页面未建成就放置在线上,并返回404状态码,被百度当成死链删除,造成收录和流量损失。

相对这样子的问题,建议网站使用503返回码,这样子百度的抓取器接到503返回码后,会在隔一段時间再去浏览这样的地址,在您的页面建好上线后,就又能被重新抓取,页面及时被抓取和索引,防止未建好的信息设为404后提供不用要的收录和流量损失。

其它建议和总结:
1、假如百度spider对您的站点抓取压力过大,请尽量不要使用404,一样建议返回503。这样子百度spider会过段時间再来尝试抓取这样的链接,假如那个時间站点空闲,那它就会被胜利抓取了

2、假如站点临时关闭或者页面暂未建好上线,当网页不能打开时以及没有建好时,不要立即返回404,建议使用503状态。503可以告知百度spider该页面临时不可浏览,请过段時间再重试。

以上信息由新概念科技(上海网站制作,上海网站制作)为您提供,越来越多精彩信息:http://www.jianzhan0.com/

本文章由新概念互动原创,如没特殊注明,转载请注明来自:http://www.jianzhan0.com/jingyand/74040.html