网站日志分析是SEO一个很重要的工作,在网站常规SEO期间,要定期观测一次,并且进行统计记录分析。一个合格的站长或者seoer必须要能看懂网站的服务器日志文件,这个日志记录了网站被搜索引擎爬取的痕迹等等。
打开一个网站文本log,会看到如下大概信息(下图):
#Software: Microsoft Internet Information Services 7.5
#Version: 1.0
#Date: 2016-04-25 00:39:00
#Fields: date time s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-Agent) sc-status sc-substatus sc-win32-status time-taken
对于这个日志有些新手看了一头雾水。下面为大家作详细介绍:
1、#Software: Microsoft Internet Information Services 7.5
说明这个日志是ISS生成的,代表微软的Web服务器 IIS 7.5是版本号
2、#Version: 1.0
版本号:1.0
3、#Date: 2016-04-25 00:39:00
日志生成的日期、时间
4、#Fields: date time s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-Agent) sc-status sc-substatus sc-win32-status time-taken
参数详解:
* date(日期) 2016-04-25
* time(时间) 00:39:00
* s-ip:服务器的IP地址
* cs-method 请求中使用的HTTP方法,GET/POST。
* cs-uri-stem URI资源,表访问的资源是当前这个文件
* cs-uri-query URI查询,具体的访问参数
* (cs-uri-stem+ cs-uri-query=实际访问的文件:/b2b_cplist.asp? catid=30)
* s-port(服务器端口) 80
* c-ip(客户端IP) 211.155.23.176(实际是网站所在服务器的IP)
* cs(User-Agent) 用户代理,客户端浏览器、操作系统(蜘蛛抓取)等情况。
* sc-status(协议状态) 记录HTTP状态代码,200表示成功,304一般表示这页面没更新,403表示没有权限,404表示找不到该页面。
* sc-substatus(协议子状态) 0
* sc-win32-status(Win32状态) 记录Windows状态代码。如果被32位的系统访问,那么这里记录的就是0,如果被64位系统访问,那么这里记录的就是64……
* ime-taken:记录操作所花费的时间,单位是毫秒。
分析:2016-04-25 01:42:27 122.114.88.183 GET /jzxzd/ - 80 - 123.125.71.56 Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html) 200 0 0 122
百度蜘蛛在2016-04-25 01:42:27 通过80端口爬过/jzxzd/这个页面。
新建一个excel表格,把.log文件里的文件粘贴到新建的excel表格里面。复制之后,全选A,在工具栏里选择数据→分列,如下图所示:
选择分隔符号,点击下一步:选择空格、Tab键前面的钩,点击完成。(如下图所示)网站的iis日志就这样被拆分出来了,之后自己再调整一下表格的列宽、升降序等即可。
本日志分析excel文件下载地址http://pan.baidu.com/s/1nvaSwCL
评论