资讯页不收录怎么回事?原来是站点的抢发行为不友好
发布时间:2020-11-10作者:帝国建站网
里约奥运会结束了,资讯站点的小编们终于可以松口气了,可有些SEOer却高兴不起来:编辑辛苦抢先制作的原创稿件,百度却不!收!录!奥运会期间接到了四五起这样的反馈,经追查,原来是站点的抢发行为不够友好,导致spider抓取失败。结论:
1,页面制作完成后再放到spider可以发现的地方,这样才能达到最好的抓取效果。
2,页面未对外公开之前,千万不要通过工具推送给百度呀。
接到站长反馈后,联系了spider工程师,工程师在后台查询了这些未收录的链接,发现均显示为“死链”,然而这些所谓的死链现在访问都是好好的。根据后台显示的抓取时间,反复和站点进行沟通,终于找到了根源:原来,站点为了抢新闻,提前制作了新闻稿并制作成链接并且发布,虽然没有在首页等重要页面推送给用户,但却被BaiduSpider发现,更重要的是,这些链接向BaiduSpider返回的状态码是404。
举个例子,中国女排进入决赛后,某网站做了A和B两个页面,分别为夺冠和摘银,为了防止用户在比赛结束之前阅读到页面内容,站点将两个链接都设置为404!404!(等到比赛结束后,再将其中一个页面的html返回码改为200)。虽然页面并没有向用户推送,但还是被聪明的BaiduSpider发现。然而这里的问题是,BaiduSpider发现页面是404,又无法判断出这是一个重要页面,于是直接打入冷宫不再理睬。
所以,小编反复强调,确认页面真的不需要被搜索引擎保留时可以使用404(临时闭站可使用百度站长平台的闭站保护工具),如果还希望和搜索引擎保持友好关系的话,请使用503,防止页面被删除。虽然Baidu有对高价值内容的“删除保护”功能,但毕竟不是每个站点都可以享受到这个特权的。
相关建站知识
- 07-19帝国CMS时间多少天几天前的显示代码
- 05-04帝国CMS充值提示“请选择充值类型”的解决办法
- 10-12帝国CMS会员退出后跳转到指定地址
- 05-23帝国cms自定义列表多表查询统计代码
- 12-11帝国CMS登录网站提示提示“登录超时”怎么办
- 07-10帝国CMS二次开发用PHP来替换newsnav功能
- 03-20帝国cms栏目列表页模版调用本栏目下的专题方法
- 10-03帝国CMS列表页面模板 如何调用父栏目ID
- 08-31帝国CMS后台系统设置里面的扩展变量怎么使用呢?
- 11-06帝国cms制作网站时二次开发常见问题
- 11-14帝国CMS二次开发循环自定义列表分类下的所有列表及信息
- 10-04利用phpStudy搭建帝国CMS本地环境
- 04-26帝国TAGS列表页上下页显示过多方法
- 03-02帝国CMS判断路径加样式教程
- 01-26帝国cms二次开发怎样实现时间为:几小时前、几天前等格式
- 12-17帝国CMS图集字段的大图,小图,说明怎么调用
- 05-17帝国cms标签TAG列表页显示信息数量num的方法
- 09-30帝国cms批量替换后台发布者用户名mysql语句是什么?
- 10-12帝国cms一句js实现列表页或者内容页当前栏目高亮
- 02-12帝国cms列表与内容页简介信息显示优化和相关问题!