追踪网站高层业务或功能特定的测量数据
通常用这些数据追踪网站事件。就Flickr来说,表示上载照片数、新顾客注册数、平均照片大小、总的磁盘空间消耗量、卖出出了多少Pro账号、有多少求助信息登记及解决了多少,等等。由于这些数据一般用来做长期趋势剖析,以便开展产品预测或容量规划,因此,以天为采集频度就够了。增加分辨率,一天多采几次,对结果没有任何决定,反而增加生成报表的時间,数据移动起来也很麻烦。每天采集一次这些数据很简单,每天夜里运行一个cron作业就可以,将数据存入复制用的数据库子机,这台数据库子机便是用来处置这些数据的。
由于这些数据存于数据库中,而且日期是恒定的,故此对这些数据开展跨地理环境处置或相应性剖析就很直接了。
例如,由于节假日期间,新的数码相机经常被作为礼物赠送,故此,与平时比起来,节假日期间的平均照片上载量有非常大增长,就不奇怪了。有了这些数据,咋们可以针对相同日期计算出其他值来,故此,咋们可以毫无困难地观察平均上载大小是如何增加磁盘空间消耗的(由于照片的原始尺寸变大了),从而相应地增加FlickrPro账号的订购量(与免费账号相比,Pro账号没有容量限制)。
有了这些高层数据之后,你的机构中面向产品的那些人对这些数据也抱有极大的兴趣,你一点都不必感到惊讶。虽然你可能是用磁盘空间消耗数据为存储需求做容量规划,但他们却另有看法,比如,这些使用情况的数据可以赞助他们做基本功能发布的時间表。网站使用情况有助于制定产品路线图,产品路线图有助于容量规划,容量规划有助于预算以及基础架构的前途,等等。你很庆幸是以一种简单且可移植的格式存储这些数据的,由于机构中的任何人都可能用到这些数据。
相对应用层面的数据,最有用的是可以跟踪顾客的交互情况。比如一个社会网络站点,顾客可以与其他顾客成为为朋友”、上载照片,或在其他顾客页面上发表评论。记录这些事件是不能用正规的時间间隔的方法的,这与采集CPU测量数据不同,采集CPU数据用的是正规的時间间隔方法一比如说,每隔15秒开展采样。这种方法与前述将每天发生的事件开展累加的方法也不同。将这些非周期性事件与周期性事件开展相应性剖析时,要确保時间尺度是固定的。
Flickr的这种非正规类型的一个例子如下:咋们发布了一个基本功能,让你导入多种邮件地址簿,并将这些地址簿中的名字及邮箱与你还不是联系人的网站成员开展关联,然后批量增加联系人。假如咋们只是将每天产生了多少联系人开展累加的话,咋们在图上就会看到那个数据点上有个跳变,但这样的基本功能发布后,并没有看到跳变,在随后的数小时一直到下周,也都没有看到。一样的情况还有顾客对照片开展标注(tagging)的基本功能。清楚这些信息有助于咋们将来如何发布网站开发新基本功能,那便是一在发布基本功能以前,咋们应该准备数据采集(对这些情况而言,便是一张MYSQL的汇总表)。
本文章由新概念互动原创,如没特殊注明,转载请注明来自:http://www.jianzhan0.com/jingyand/72184.html