seo日志分析重点在哪里?seo日志分析需要关注的三个重点数据
网站日志是什么,引用百度百科的定义“网站日志是记录web服务器接收处理请求以及运行时错误等各种原始信息的以·log结尾的文件,确切的讲,应该是服务器日志。”通过这个定义可以了解到网站日志记录了最全的网站运行信息,主要包括访客信息(比如访客ip、用什么浏览器、操作系统、访问时间等等)、蜘蛛对网站的抓取情况(抓取了哪些目录、都有哪些蜘蛛等等)、运行错误信息(主要是看一些http状态码)。
那这么多信息,我们需要重点关注的有哪几个点呢?
一、蜘蛛抓取情况
1、都有哪些蜘蛛来访问
看一下主流的蜘蛛是否有访问网站,如果没有的话,可能是被网站屏蔽了,可以检查下网站的robots文件设置。
2、抓取了哪些目录
统计蜘蛛对网站目录的抓取情况,网站各层级目录是否抓取正常,一些需要重点推广的目录是否有抓取,如果没有抓取的话则需要对网站内链进行调整或者增加外链,提升栏目权重,引导蜘蛛抓取。另外,蜘蛛可能会抓取一些无意义的目录,比如我们不希望搜索引擎了解的信息,这时候就可以把这些目录屏蔽掉。
3、抓取了哪些页面
统计蜘蛛对网站页面的抓取情况,通过一段时间的观察你会发现蜘蛛经常抓取的一些页面,分析蜘蛛为什么喜欢这些页面,这些页面跟其它页面相比有什么不同,有没有其它页面可以借鉴的地方。此外,还可以通过分析页面抓取情况,了解到网站的一些问题,比如重复页面问题、url规范化问题等等。
4、蜘蛛访问次数、停留时间、抓取量
蜘蛛频繁访问网站,说明喜欢网站,经常来看看网站内容是否有更新,对网站来说是一件好事。如果十天半个月才来一次,那网站内容可能得更新勤快点了,另外还要多增加一些外链,引导蜘蛛访问网站。停留时间长短可以反映蜘蛛对网站的喜欢程度,需要注意的一点是,如果停留时间长,但是抓取量低的就有问题了,可能是蜘蛛对网站内容抓取困难,或者网站内容质量偏低导致的。这三个指标要综合起来看,才会得到比较有价值的信息。
二、http状态码
主要关注的有404、500、302之类的。404就不用说了,最好定期整理死链接,并提交到站长平台。如果经常出现500,可能是服务器的问题,比如内容太多,服务器无法满足需求,超负荷运转了,就会出现超时、无法访问的情况。302是暂时重定向,这个要具体看下是什么问题,搜索引擎比较喜欢301,如果可以的话就做成301的。
三、网站安全情况
通过日志分析,还可以及时了解到网站是否安全,像作者本人优化的一个站点,是通过日志分析才发现被挂了黑链的。分析日志的时候如果发现一些不存在的目录,或者一些奇怪的页面,就要仔细去分析一下,很可能就是有问题的。
以上就是作者本人在网站日志分析方面的一些心得体会,希望能够帮助到大家。网站日志分析是需要长期坚持的工作,一朝一夕可能发现不了问题,贵在坚持。
题外话:网站日志分析肯定少不了日志分析工具,该如何选择日志分析工具呢,个人认为主要还是得用着顺手的,一些主流的日志分析工具基本都可以满足需求,工具不分好坏,各有千秋,我就比较喜欢金花跟光年一块用,各取所长嘛。
相关建站知识
- 03-13帝国CMS搜索页面模板不支持灵动标签和万能标签的解决方法
- 05-31帝国WAP模板二级域名伪静态规则
- 11-25帝国CMS后台登录显示空白的解决方法
- 05-26帝国cms调用最后更新修改时间方法和最后修改时间代码
- 03-19帝国cms如何防止你的网站数据被采集
- 02-09帝国CMS信息排行榜调用标签是什么(24小时排行、本周排行、本月排行信息调用!)
- 05-19帝国CMS搜索表单制作教程
- 09-07帝国cms在内容页模板里添加错误报告链接
- 12-28帝国CMS SQL标签多表查询
- 10-28帝国CMS自定义列表调用当天发布的信息!
- 11-21帝国CMS完美替换“当前位置导航”[!--newsnav--]
- 10-25帝国CMS支持内嵌标签多规则多类型调用循环子栏目数据
- 06-30帝国CMS模板自定义页面用PHP获取页面ID、页面名称、标题、关键词、描述、内容等变量的方法
- 04-21帝国cms栏目绑定域名
- 05-29在帝国CMS内容页模板里调用附属专题
- 08-01帝国cms用灵动标签调用友情链接的方法
- 08-18帝国获取简介代码格式去空格换行的解决方法
- 11-20帝国CMS验证码功能升级
- 05-01帝国CMS模板内容页没有相关信息
- 05-09帝国CMS列表页模板list.var中调用栏目名称非栏目别名的代码