当前所在位置:首页 > 建站常识
欢迎您访问灵风网络,我们将提供您最优惠的建站套餐,祝您工作愉快!如有疑问请咨询客服

统计系统的五维理论

发布时间:2012-05-02 来源:www.fo-sky.com 浏览次数: 分享到:
更多

最近一直在思考统计系统的统计规则怎样实现。昨天终于有了一点灵感,可以用数学模型来描述统计系统。(这里所说的统计系统是指网站统计系统web analytics)

统计系统统计的是访问者在对网站的访问情况,或者说是访问者的访问行为。这里面包含三个基本要素:

1.访问者
访问者对应ip,但有共享上网的情况,所以更准确点,需要对应cookie。

2.网站
说是网站,其实更准确的说应该是url,传统的网站都是一个url对应一个叶面,统计系统的统计也都是基于url的。但随着动态技术、ajax、flash等在服务端存储状态以及异步应用的出现,很多url指代的内容也不再固定(这个暂不考虑)。
url又包括两种,来源url(referrer)和目标url(当前网页)

3.时间
这个不用说了,一切以时间为基础。

上面三个就形成了用户访问网站的最基本三维,目前大多数统计系统还是基于这三维的,而且大部分是不是完整的建立在这个三维坐标系内,很多只是分别实现了2和3的二维,1和3的二维;1和2的联系没有完整建立起来。比如51.la、google analytics等。

完整建立起三维空间的统计系统很少,目前我知道的只有getclicky.com,还有我自己的统计系统(www.referer.cn):P
getclicky的三维并不完整,我简单看了一下它的演示,时间轴是有区间的,只在一天(day)的范围上有效,跨日的统计没有建立。
referer比较完整,但目前实现的统计规则比较少。

上面说了三维,另外的两维从何而来呢?

三维的统计系统只是实现了用户访问的统计,并没有实现用户在网站上行为的统计。什么是用户行为呢?也就是用户在网页上干什么,是在读还是在写?用户要在网页上产生行为,必须通过电脑,通过鼠标键盘,所以对用户行为的统计转化为对鼠标键盘操作的统计。通过简单的触发,我们可以统计到用户在页面的什么位置点了鼠标,用户通过键盘输入了什么内容。

对键盘行为的捕获意义不是很大,但实现难度和成本却很高,所以暂且放弃对键盘事件的统计。

剩下的就是对鼠标行为的统计了,鼠标的运作原理就是在屏幕的二位坐标系内确定坐标。我们要做的就是捕获鼠标的坐标以及点击行为。通过对鼠标行为的捕捉和深入分析,可以获得很多有价值的数据。

因而产生了统计系统另外的两个纬度:屏幕的坐标。

这种行为统计系统数据量要大很多,大部分系统只是实现了部分的统计,比如只统计点击时的坐标,clicktale和tapefailure完整统计了鼠标移动轨迹,估计是由于数据量的原因,clicktale到现在只是小范围测试,没有进展。tapefailure似乎是模仿着clicktale来的,回放界面都差不多。

referer是目前是实现点击统计,但只是开放了链接上点击的统计,效果可以在我的blog上看到,点击过的链接上会有一个浮动的统计标签。

随着互联网应用的发展,仅仅做到这五维的统计是不够的,就像前面提到,flash和ajax应用,已经使内容和url不再一一对应。这就使得统计精确度和难度更大,如果要做到这方面的统计,那就不是三维或者五维能够完成的了。




希望以上信息能够帮助您,如果您还有关于大连网站制作,大连网站建设,大连网页设计,大连做网站,大连个人做网站及网站相关问题,请与我们联系,大连灵风科技将竭诚为您服务!

--- 大连灵风网络科技 祝您生意兴隆!