关于我们 RRS sitemaps 网站地图

首页 > SEO基础 > SEO入门 > 正文

SEM论坛

网站IIS日志分析及IIS日志爬行状态码讲解

2012-09-05 01:22:30 |  评论:0  |  点击:  |  SEM论坛

什么是IIS日志

  IIS日志是每个服务器管理者都必须学会查看的,服务器的一些状况和访问IP的来源都会记录在IIS日志中,所以IIS日志对每个服务器管理者非常的重要,seoer也不例外,这点同时也可方便网站管理人员查看网站的运营情况。

 IIS日志位置

  1) 虚拟空间 (一般都在FTP中的一个叫LOG文件夹中、如果没有可以联系空间商索要)

  2)服务器及VPS (服务器及VPS基本上都会有控制WEB服务器的权限、无论是IIS还是APCHE都是可以设置的、具体方法在就这不说了)

 IIS日志记录属性

  如:IIS服务器 - IIS属性 - 1、常规属性 2、扩展属性

一般来说、设置好了LOG保存位置、可能只是默认记录了参数、而我们做SEO优化者、可能需要参考记录不同! (具体设置参考个人需求)

具体可以参考下: 百科:http://baike.baidu.com/view/1604448.htm IIS日志

  -----------------------------------------------------

 网站日志_分析IIS日志

  例:2009-11-26 16:00:01 GET /index.asp - - 66.249.67.41 HTTP/1.1 Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) - 200 71879 .

  分析 ..

  date(日期)===========2008-10-14

  time(时间)===========16:00:01

  cs-method(方法)=======GET .

  cs-uri-stem(URI资源)==== /index.asp //代表访问的资源是当前这个文件 !

  cs-uri-query(URI查询)==== - //

  cs-username========== - .

  c-ip(客户端IP)==========66.249.67.41 ...

  cs-version ============HTTP/1.1 //协议版本 .

  cs(User-Agent)=========Mozilla/5.0+ (compatible;+Googlebot/2.1;++http://www.google.com/bot.html) //谷歌在收录 ..

  cs(Referer) (引用站点) ===== - //搜索的站点 .

  sc-status(协议状态)======= 200 //200表示OK 特别注意:

  sc-bytes(发送的字节数)===== 71879 //表示当前文件的大小

 

 IIS日志常见的状态代码为:

  200 - 服务器成功返回网页

  404 - 请求的网页不存在

  301 - 请求的数据具有新的位置且更改是永久的

  503 - 服务器暂时不可用

 网页状态码含义:

  2xx 成功

  200 正常;请求已完成。

  201 正常;紧接 POST 命令。

  202 正常;已接受用于处理,但处理尚未完成。

  203 正常;部分信息 — 返回的信息只是一部分。

  204 正常;无响应 — 已接收请求,但不存在要回送的信息。

  3xx 重定向

  301 已移动 — 请求的数据具有新的位置且更改是永久的。

  302 已找到 — 请求的数据临时具有不同 URI。

  303 请参阅其它 — 可在另一 URI 下找到对请求的响应,且应使用 GET 方法检索此响应。

  304 未修改 — 未按预期修改文档。

  305 使用代理 — 必须通过位置字段中提供的代理来访问请求的资源。

  306 未使用 — 不再使用;保留此代码以便将来使用。

  4xx 客户机中出现的错误

  400 错误请求 — 请求中有语法问题,或不能满足请求。

  401 未授权 — 未授权客户机访问数据。

  402 需要付款 — 表示计费系统已有效。

  403 禁止 — 即使有授权也不需要访问。

  404 找不到 — 服务器找不到给定的资源;文档不存在。

  407 代理认证请求 — 客户机首先必须使用代理

  对SEO优化者来说,IIS日志是必须了解的基本入门信息,不仅需要了解IIS日志状态码含义,而且还需要了解各大搜索引擎爬虫(蜘蛛Robot)名称。通过IIS日志我们可以了解到蜘蛛爬取情况及网站流量访问情况。

----------------------------------------------

解析robots.txt的正确使用方法

 

 

关键字:IIS日志分析

本周点击排行

SEM论坛