霜天部落 | 关注LAMP高性能、高并发架构的设计与研究

pv是什么?

现在国内的站点都号称自己能统计pv,不过听我讲完pv到底是什么,估计所有的站长都要笑了。
pv的意思,就是一个访问者在24小时(0点到24点)内到底看了你网站几个页面。

不过在国内,由于站长普遍素质不高,理解的是五花八门。有的是认为就是刷一次算一次,有的认为是cookies记录一次,有的认为是cookies记录每个页面一次。国内计数器采用第一种理解的比较多,第二种就相当少了,第三种虽然也是错误理解,但毕竟和正确结果有些相紧,但是总比完全错误强。不过及时是第三种的记录方法,由于他的cookies记录需要相当的技术水平来编写,还没有采用这种方法的。

真正的pv是怎么计算的呢,就是当一个访问来访问的时候,记录他所访问的页面和对应的ip,然后确定这个ip今天访问了这个页面没有,由于涉及的元素有两个就比单纯记录ip要多一列。具体的比对方法比较复杂,我这里就不更深入说了,仅从数据库的量上来描述一下吧,如果到了23点,单纯ip有60万条的话,每个访问者平均访问了3个页面,那么pv表的记录就要有180万条,每来一个访问者除了比对那60万ip外,还要继续比对这180万的pv表,大家就可以想象这种运算量了。

所以说,国内现在不仅记录24小时独立ip的统计寥寥可数(一些付费统计还是记录24小时独立的),记录pv的更是根本没有,我在服务器负载低的时候曾经尝试过统计pv,但是很快就被运算量难住了,再cpu和相关设备性能提升十倍以前,我都不准备提供此项服务.