作为seoer 你真的了解服务器日志吗

  作为seoer 你真的了解服务器日志吗?真正意义上的网站分析是从服务器日志开始的,而且直到今天,分析服务器(也称为server log file,或简称log file)日志仍然是网站分析的重要方法。对于服务器日志的分析并不容易进行,初学者,以及在绝大多数情况下,进行以用户行为分析为核心的网站分析,都是用不到服务器日志的,而是通过流量统计工具,不过,作为网站分析历史不可分割的一部分以及重要的基础篇章,服务器日志法仍然值得一学的。

作为seoer 你真的了解服务器日志吗-辟辟博客

  【服务器日志是什么】

  这里的服务器指的是网站服务器(Web Server),而服务器日志跟飞机的黑匣子一样,是用来记录网站服务器的运行信息的,或者简单说,是用来记录服务器中的什么页面在什么时候被谁访问了。简单的来说,服务器日志是记录web服务器接收处理请求以及运行时错误等各种原始信息的以.log结尾的文件。

  网站日志最大的意义是记录网站运营中比如空间的运营情况,被访问请求的记录,通过网站日志可以清楚的得知用户在什么IP?什么时间?用什么操作系统?什么浏览器?什么分辨率显示器的情况下访问了你网站的哪个页面?是否访问成功?网站分析就是从网站服务器日志开始的,或者更准确的说,网站服务器日志自诞生之日起,就是为网站分析所用的。

  例如,如果你访问一次我的网站:http://www.xawzseo.cn,那么一般情况下,网站服务器的日志就会记录在某时某刻来自某个IP的访问者索引了网页“/index.php”,当然,网站服务器日志还会记录其他许多内容,这些内容能够帮助我们分析网站的流量和访问者在网站上的行为。

  最早,人们可是把所有的记录都拿出来,然后导入到数据软件中去进行分析,辛苦程度自不用说;但这个痛苦的阶段不会持续太久,哪儿有痛苦,哪儿就有生意,所以网站日志分析软件就出现了,解决了很大的问题,以至于大小互联网服务提供商(ISP)们都为租用他们空间的用户提供一款免费的网站日志分析软件。

  尽管如此,辟辟博客觉得分析网站日志一直都是一个相当不容易的事情,所以,人们不得不寻找一些更便利的方法,这样便发明了网站分析的新的数据获取方法,这是后话了。

  【服务器日志是如何产生的】

  上面这个图说明了网站服务器日志是如何产生的,当用户访问一个网站的时候,事实上是访问这个网站的某一个具体的页面,我们假设这个页面叫Page1,这时,我们的这个访问行为会请求服务器中Page1的实际的文件,随之把这个文件下载到浏览器上,由于请求和下载行为都会引起服务器的响应和相应的行动,因此就有必要记录下服务器的这些行动。

  你会问,为什么需要记录服务器的行动呢?原因很简单,因为我们不想让这个服务器变成“哈尔9000”啊(哈尔9000是库布里克《2001太空奥德赛》里面有了自我意识的电脑,它直接威胁到了电影中的宇航员)!当然,这也只是个玩笑。

  不过,其目的并无差别,就是能够通过服务器日志,对服务器的运行历史进行记录,这样当有任何异常情况发生的时候,我们都能够通过日志探寻问题发生的原因,跟记录飞机运行状态的黑匣子的作用十分类似。

  【服务器日志包含的信息】

  原理看起来并不复杂,不过log file实际上并不简单,为了让log file具有可读性,log file并不可以按照各个网站所有者的喜好随意记录的,而是有自己的规范,W3C组织定义了server log file的通用格式,而其他一些组织或者个人又根据自己的需要额外扩展了这个格式,使log file能够比较全面地记录网站服务器进行的各种活动。一条标准的web server log记录通常包含如下信息:

  ①、远程主机(Remote Host)的IP地址/名字

  ②、登录名(Log Name)和登录全名(Full Name)

  ③、请求发生的日期(Date)

  ④、请求发生的时间(Time)

  ⑤、和标准格林威治时间的差值(GMT Offset)

  ⑥、请求的方法(Request Method)

  ⑦、请求的文件的地址(File)

  ⑧、请求遵守的协议(Protocol)

  ⑨、请求的状态(Status)

  ⑩、被请求文档的长度(Length)

关键字: 作为seoer 你真的了解服务器日志吗
西安SEO  辟辟博客  网站地图   博客主题:SEO,西安SEO,西安网站优化,西安网站建设,SEO教程,seo工具