我们可以按维度来查询分析指标,也可以按指标来查询分析维度。按指标来查询分析维度时,由于具体指标值太多,需要先对指标值进行分组。分组的方法包括:
(1)单项式分组与组距式分组。单项式分组,例如查询成本为10 0元的产品有多少;组距式分组,例如查询成本在100元至1000元之间的产品有多少。
(2)等距分组与异距分组。等距分组,例如查询成本在1元至1000元、1000元至2000元、200元0至3000元之间的产品分别有多少;异距分组,例如查询成本在1元至100元、100元至1000元、1000元至10000元之间的产品分别有多少。
如果制定了分组标准,查询分析是比较简单的,但制定分组标准本身却并不容易,特别是在数据量巨大时。不合理的分组标准不但无法反映分布特征,而且会把不同性质的数据混在一起导致扭曲实际情况。为了制定合理的分组标准以正确反映分布特征,需应用聚类技术。一些专业的统计学软件提供了聚类算法。