网站IIS日志分析及IIS日志爬行状态码讲解 |
发布时间: 2012/9/15 14:19:30 |
什么是IIS日志
IIS日志是每个服务器管理者都必须学会查看的,服务器的一些状况和访问IP的来源都会记录在IIS日志中,所以IIS日志对每个服务器管理者非常的重要,seoer也不例外,这点同时也可方便网站管理人员查看网站的运营情况。
IIS日志位置
1) 虚拟空间 (一般都在FTP中的一个叫LOG文件夹中、如果没有可以联系空间商索要)
2)服务器及VPS (服务器及VPS基本上都会有控制WEB服务器的权限、无论是IIS还是APCHE都是可以设置的、具体方法DJ小向在就这不说了)
IIS日志记录属性
如:IIS服务器 - IIS属性 - 1、常规属性 2、扩展属性
一般来说、设置好了LOG保存位置、可能只是默认记录了参数、而我们做SEO优化者、可能需要参考记录不同! (具体设置参考个人需求)
具体可以参考下: 百科:http://baike.baidu.com/view/1604448.htm IIS日志
-----------------------------------------------------
网站日志_分析IIS日志
例:2009-11-26 16:00:01 GET /index.asp - - 66.249.67.41 HTTP/1.1 Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) - 200 71879 .
分析 ..
date(日期)===========2008-10-14
time(时间)===========16:00:01
cs-method(方法)=======GET .
cs-uri-stem(URI资源)==== /index.asp //代表访问的资源是当前这个文件 !
cs-uri-query(URI查询)==== - //
cs-username========== - .
c-ip(客户端IP)==========66.249.67.41 ...
cs-version ============HTTP/1.1 //协议版本 .
cs(User-Agent)=========Mozilla/5.0+ (compatible;+Googlebot/2.1;++http://www.google.com/bot.html) //谷歌在收录 ..
cs(Referer) (引用站点) ===== - //搜索的站点 .
sc-status(协议状态)======= 200 //200表示OK 特别注意:
sc-bytes(发送的字节数)===== 71879 //表示当前文件的大小
IIS日志常见的状态代码为:
200 - 服务器成功返回网页
404 - 请求的网页不存在
301 - 请求的数据具有新的位置且更改是永久的
503 - 服务器暂时不可用
网页状态码含义:
2xx 成功
200 正常;请求已完成。
201 正常;紧接 POST 命令。
202 正常;已接受用于处理,但处理尚未完成。
203 正常;部分信息 — 返回的信息只是一部分。
204 正常;无响应 — 已接收请求,但不存在要回送的信息。
3xx 重定向
301 已移动 — 请求的数据具有新的位置且更改是永久的。
302 已找到 — 请求的数据临时具有不同 URI。
303 请参阅其它 — 可在另一 URI 下找到对请求的响应,且应使用 GET 方法检索此响应。
304 未修改 — 未按预期修改文档。
305 使用代理 — 必须通过位置字段中提供的代理来访问请求的资源。
306 未使用 — 不再使用;保留此代码以便将来使用。
4xx 客户机中出现的错误
400 错误请求 — 请求中有语法问题,或不能满足请求。
401 未授权 — 未授权客户机访问数据。
402 需要付款 — 表示计费系统已有效。
403 禁止 — 即使有授权也不需要访问。
404 找不到 — 服务器找不到给定的资源;文档不存在。
407 代理认证请求 — 客户机首先必须使用代理
对SEO优化者来说,IIS日志是必须了解的基本入门信息,不紧需要了解IIS日志状态码含义,而且还需要了解各大搜索引擎爬虫(蜘蛛Robot)名称。通过IIS日志我们可以了解到蜘蛛爬取情况及网站流量访问情况。
----------------------------------------------
更多IIS日志分析软件:
1、网站iis日志分析软件(超强)
2、网站蜘蛛爬取分析工具
3、光年SEO日志分析系统 2.0 (推荐 中大型网站使用)
4、IIS日志分析工具_金花IIS日志分析软件(推荐 中小型网站使用) 本文出自:亿恩科技【www.enkj.com】 |