网站优化必看 蜘蛛陷阱 不利于蜘蛛爬取的网页
发布时间:2022-07-01作者:帝国建站网
1、搜索引擎能不能找到网页。
1)要让搜搜引擎发现网站首页,网站推广就必须有良好的外部链接链接到首页,就找到了首页,然后蜘蛛会沿着链接爬的更深。
让蜘蛛通过简单的html页面的链接到达,javascript链接,flash链接都是蜘蛛的陷阱。这点要注意。
2)找到网页后能不能抓去内容。
被发现的蜘蛛是可以被爬取的,数据库动态生成,带过很多的参数url、sessionID、整个页面都是flash、框架结构、大量的转向,和大量的复制内容都可能把蜘蛛拦截在门外。这也也是要注意的
2、flash
1)在网页某一个部分使用flash来增强视觉效果很正常网络推广,比如现在很多的flash广告、图标等。但是这是一个html页面的一部分。不会有太大的影响
2)但是有的网站就是一个很大的flash文件,这就构成了蜘蛛的陷阱,这时候蜘蛛爬取的只有一个flash链接,没有其他的内容,所以这点尽量要避免。
3、sessionID
1)有些网站使用sessionID(会话ID)跟踪用户的访问,用户的没一次访问都会生成一个独立的ID,然后加在url里,这是蜘蛛每一次抓取网站都会把蜘蛛当作一个新的用户网络营销,造成蜘蛛不能正常爬取,这也是蜘蛛的一大陷阱。
2)通常建议跟踪用户访问应该使用cookies而不要生存sessionID 。
4、各种的跳转
1)除了大家熟悉的301转向之外,其他的转向对搜索蜘蛛都比较敏感的,比如302暂时转向,javascript转向,flash转向,meta refresh跳转,所以建议大家不要做其他不利于网页的转向,301也包括,不到万不得已的时候也不要用301转向。这是个建议。谢谢阅读,希望能帮到大家,请继续关注帝国建站网,我们会努力分享更多优秀的文章。
相关建站知识
- 06-11帝国CMS二次开发会员中心URL模板路径汇总
- 09-16帝国二次开发不同会员组显示不同投稿字段
- 04-04帝国CMS灵通标签判断是否有标题图片并输出
- 11-24帝国CMS百度编辑器ueditor前台代码高亮无法自动换行解决方法
- 11-15帝国cms列表页调用tags教程
- 04-12帝国CMS搜索页模板分页如何去掉信息总数
- 02-22帝国cms后台恢复数据库出现的错误
- 10-11帝国CMS二次开发自定义页面调用会员信息
- 10-07帝国cms按tag调用相关内容
- 08-10帝国cms内容页模板点击量数值过万时,换成万为单位
- 10-04帝国CMS列表/标签/JS支持置顶的方法
- 12-30帝国cms模板内容页灵动标签调用当前栏目文章排除当前文章
- 08-27帝国CMS让信息内容ID从1开始的方法!
- 06-01帝国CMS灵动标签调用栏目并当前高亮
- 11-21帝国CMS 给TAG添加首字母自动获取首字母
- 04-26帝国CMS取消会员注册时候的邮箱必填
- 11-05帝国CMS批量设置正文第一张图片为缩略图方法
- 07-09帝国cms首页获取调用会员数量、用户留言数量以及评论数
- 12-09帝国cms数据表phome_ecms_news_doc_data
- 04-16帝国CMS标签调用记录范围小技巧