当前位置: 南昌seo > 南昌网站优化 >

用工具检查出的404和死链等怎么处理?

来自:喻老师| 发布时间:2019-05-09 14:44 | 作者:喻老师
  先明白什么是内链死链、链出死链、链入死链 
  假设您的网站是www.abc.com,第三方网站是www.example.com。
  内链死链:在您网站上发现同一个域名内的死链,即:如果在http://www.abc.com/1.html上发现了一条死链http://www.abc.com/2.html,那么我们称http://www.abc.com/2.html为内链死链;
  链出死链:在您网站上发现的链接到其他网站的死链,即:如果在http://www.abc.com/1.html上发现了一条死链http://www.example.com/1.html,那么我们称http://www.example.com/1.html为外链死链;
  链入死链:在其他网站上发现的链接到您网站的死链,即:如果在http://www.example.com/2.html上发现了死链http://www.abc.com/2.html,那么我们称http://www.abc.com/2.html为链入死链。
  死链示例展示中,死链链接、死链前链、锚文本、发现时间分别代表什么含义。
  死链链接:Baiduspider在尝试抓取该网页时,该网页返回了404代码;?目前死链链接只针对协议死链,后续会陆续增加跳转死链和内容死链。
  死链前链:从该网页经过一次点击即可到达当前死链链接,称该网页为当前死链链接的前链,即死链前链。
  锚文本:在死链前链这个网页上发现的对应该死链链接的文本信息。
  发现时间:Baiduspider最近一次抓取该死链链接的时间。
  404页面是404状态码出现时服务器通过配置调用给用户看的一个页面,这个页面是在前台页面中不存在导入链接的,所以不需要屏蔽掉。蜘蛛访问死链的时候,如果你设置了404页面 才会显示,如果没有会显示IIS自带的页面,而蜘蛛在这个时候是不在乎404页面的内容的,而是在乎你的网站是否返回的404状态码。
  所以看出,屏蔽掉和不屏蔽掉,我觉得没有任何的关系。除却一种情况就是你的前台页面中有链接指向你服务器的404页面文件,那么这个时候404页面就会被当成是一个普通的页面,不在仅仅是404状态码返回给用户的视觉体验,而是像你网站所有页面中的一个页面一样是可以在前台被蜘蛛爬行和抓取的,这个时候屏蔽掉就会和屏蔽普通页面一样,蜘蛛会遵循你的Robots 里面的设置来执行。两种情况会有两种不同的结果。
  所以我个人是偏向于屏蔽掉,宁可错杀不可放过,而且错杀目前在我看来没有任何影响,返回404状态码的页面屏蔽有关系吗?求指点,反正我是先屏蔽掉。日志上不能访问的,自己在检测一下是不是真正的404页面,能不能打开,然后再把这些错误页面搜集起来,然后制作死链,并提交给百度。

原创文章,严禁转载!一经发现,必究责!如需转载请注明出处:如本文来源:文章网址。