市场调研——不得不提的三个数据处理方法

所有市场营销专业出身的人,都系统地学习过市场调查这门课程,即使非营销专业出身的营销人员,也大都参与执行过公司组织的各类市场调查工作,众多的消费者更是或多或少地接受过各式各样的市场调查。所以说,市场调查其实离我们普通人的生活并不远。作为销售管理者,即使不能成为市场调研的专家,至少也应该对这门工具有大致的了解。

因为市场调研涉及的知识点和内容比较多,尤其涉及到统计学的知识,比较复杂,需要系统的学习,所以本节对市场调研的介绍,主要侧重易于掌握的、涉及数据类型的重要知识点的介绍,其他需要统计学知识做铺垫的数据分析方法暂不介绍。

 

重新认识平均数

 

在市场调研中,通过对平均数的计算,在评估对象的整体水平、体现样本的分布趋势上都有广泛应用。但在大多数人的观念中,平均数就是数字之和除以个数,认识更多一点的只知道加权平均数的概念和使用。这里,我们要重新认识平均数。

平均数分为数值平均数和位置平均数。数值平均数主要包括算术平均数、调和平均数、几何平均数等;位置平均数主要包括众数、中位数、分位数等,我们只介绍前两位的平均数。

 

(一)算术平均数

 

这是应用最广、最容易掌握的平均数,处理数据的限制性条件也最少,分为简单算术平均数和加权算术平均数。

以某企业各区域月销售额和实际门店数量占比为例,求区域销售的简单算术平均数和加权算术平均数。

 

表7-7 某企业各区域月销售额和实际门店数量占比

 

区域

月销售额

门店数量占比

区域A

500万元

20%

区域B

200万元

25%

区域C

400万元

10%

区域D

600万元

22%

区域E

250万元

18%

区域F

550万元

5%

 

简单算术平均数

=(样本1+样本2+样本3+……+样本n)/n

=(500万元+200万元+400万元+600万元+250万元+550万元)/6

≈416.7万元

 

加权算术平均数

=样本1×权数1+样本2×权数2+样本3×权数3+……+样本n×权数n

=500万元×20%+200万元×25%+400万元×10%+600万元×22%+250万元×18%+550万元×5%

=394.5万元

 

小贴士:在统计上,简单算术平均数比加权算术平均数应用更广,简单算术平均数主要用于处理未分组的原始数据;而加权算术平均数只能应用于分类型的分组资料。简单算术平均数可以看做是加权算术平均数的特例。

 

(二)调和平均数

 

对于无法穷尽样本个数的调研,需要确认整体样本平均数时,调和平均数就可以发挥作用了。当然调和平均数也分为简单调和平均数和加权调和平均数两种。依据下表(表7-8),求6个区域的均单销售额。

 

表7-8 各区域抽样均单销售额和销售总额

 

区域

抽样均单销售额

销售总额

区域A

2000元

500万元

区域B

1000元

200万元

区域C

1500元

400万元

区域D

2500元

600万元

区域E

800元

250万元

区域F

1100元

550万元

 

在这里,权数就是区域总销售额,当区域总销售额相等时,可采用简单调和平均数。因为权数不等,故采用加权调和平均数。

 

加权调和平均数

≈25000000元/(2500+2000+2667+2400+3125+5000)

≈1413元

 

小贴士:加权调和平均数主要用于在已知代表变量值和权数(总量值)的条件下,求整体变量值的平均数情况。当总量值相等时,即权数相等时,加权调和平均数和简单调和平均数相等。

 

(三)众数

 

众数就是在所有调研样本中出现次数最多、频率最高的标志值,如商品的交易价格可能不断变换,但是成交次数最多的那个价格就是众数价格;经销商可能对公司的很多方面都有不满,但是那个提到和投诉最多的问题,就是众数投诉项。理论上众数确认的方法非常简单:在样本中找出次数最多和频率最高项,就是该样本的众数项。需要重点介绍的是组距数列的众数确认。

组距式变量数列的众数确认分为两步,以某次调研的2500名消费者收入为例。

 

表7-9 消费者收入

 

年收入状况

消费者数(名)

10000元以下

34

10000~20000元

123

20000~30000元

157

30000~40000元

239

40000~50000元

401

50000~60000元

538

60000~70000元

318

70000~80000元

275

80000~90000元

205

90000~100000元

167

100000元以上

43

 

第一步,从样本中找出频数和频次最大的组:

显然,在这次消费者收入调研中,众数组是年收入在50000~60000元的消费者,共计538名。

第二步,依据与众数组相邻的两个组的频数,计算近似众数值。公式如下:

 

众数下限公式

=众数组下限值+ ×组间距值

或者,

众数上限公式

=众数组上限值 ×组间距值

 

故众数值为:

=50000元+ ×10000元

≈53838元

此次2500名消费者年收入水平的众数值为53838元。

 

小贴士:需要注意的是:上下限众数计算公式,只适用分组等距的样本,或者频数最多的组与附近组的组间距相等。否则,该公式得出的结果就失去了意义。

 

(四)中位数

 

中位数,顾名思义,就是在样本数据中位于中间位置的数据。对于没有分组的样本数据,只需将数据按从大到小或从小到大的顺序排列后,就可以按以下方式确认中位数。

 

当样本数为奇数时,中位数=X(n+1)/2 

当样本数为偶数时,中位数=(Xn/2+X(n/2)+1)/2

 

如 3、5、8、14、18、19、20、34、39、50、55、58、64、70。

当3~64时,共计13个数,中位数=20;

当3~70时,共计14个数,中位数=27。

分组式样本的中位数的计算稍显复杂,同时中位数的应用远不及众数广泛,这里就不再做介绍了。

 

小贴士:众数和中位数的出现,剔除了极端值对平均数的影响,相较于算术平均值来说,在反映数据的分布趋势上更有代表性。

 

 

调研分组中的交叉制表

 

在市场调研中,对于大量数据的处理,分组处理是比较理想的办法。被分到同一组的数据,应该是都具有同一个特征的数据。调研者必须知道,选择了一种分组方法,突出组内的某个共同特征,必然会掩盖其他的特征,分组特征的选择必须慎之又慎。在这里强调统计分组中的穷尽原则、互斥原则没有太多的现实意义,我在这里和大家分享的是在调研分组中的常用技巧:交叉制表,尽可能减少出现组内特征相互掩盖的问题。

交叉制表是对两个或两个以上变量间关系分析时常用的方法。它是对已经分到组内的数据进行二次分组,通过二次分组将目标调研者的信息更加集中,通常二次分组的特征是实现调研意图的关键问题。

假如某企业推出一款中高端价位的新产品,开展消费者购买意愿测试,共有1500名消费者接受测试,下表(表7-10)是消费者对测试反馈的结果。

 

表7-10 消费者测试结果

 

消费者选项

消费者态度(人)

消费者比例

肯定会购买

300

20%

极有可能会购买

750

50%

可能会/可能不会购买

225

15%

极有可能不买

150

10%

肯定不会购买

75

5%

总计

1500

100%

 

从选项结果来看,有70%的消费者极有可能或者肯定会购买新产品。对厂家来说,这是一个好消息,但是在交叉制表加入收入意图后,调查结果可能相反。

 

表7-11 考虑收入意图后的调查结果

 

消费者选项

月收入3000元及以下

月收入3000~5000元

月收入5000~8000元

月收入8000~12000元

月收入12000元以上

消费者比例

被调查人数

肯定会购买

36.14%

150

16.49%

80

19.61%

50

6.52%

15

4.35%

5

20%

300

极有可能会购买

48.19%

200

67.01%

325

49.02%

125

34.78%

80

17.39%

20

50%

750

可能会/可能不会购买

12.05%

50

7.22%

35

19.61%

50

32.61%

75

13.04%

15

15%

225

极有可能不买

2.41%

10

6.19%

30

7.84%

20

17.39%

40

43.48%

50

10%

150

肯定不会购买

1.21%

5

3.09%

15

3.92%

10

8.70%

20

21.74%

25

5%

75

总计

100%

415

100%

485

100%

255

100%

230

100%

115

100%

1500

 

在月收入8000元以上的人群中,仅有41.3%【(15+80)/230】的人对新产品有购买意向;而在月收入12000元以上的人群中,这个比例更小,只有21.74%【(5+20)/115】。

交叉制表的意义:通过加入影响调查结果的主要因素,可以更准确地把握目标人群的需求。

 

小贴士:绝大多数的市场调研分析,都是在交叉制表的基础上演变的,即使采用了复杂的数理分析方法计算,也都是以交叉制表为重要组成部分,它能够反映出很多问题。但是,很多时候取决于你是否加入了一个有创意的意图项。

 

对定性结果的定量修正

 

我们在日常市场调研中,发现大量的定性描述的选项,比如表7-10就是一个非常典型的例子。定性选项分为:肯定会购买;极有可能会购买;可能会/可能不会购买;极有可能不买;肯定不会购买。

因为有定性的描述,很多市场调研的统计人员,会完全按照被调研对象的选项,选择市场策略。实际上,很多消费者自己都不知道需要什么。所以消费者的选择,很多时候都会打折扣。根据被调研对象选择结果和实际行动之间的关联,统计后发现,在一些通用的定性结果上,可以采用修正值修正。

选择“肯定会购买”的人群,仅有80%的人会有购买行为;选择“极有可能会购买”的人群,也仅有30%的人在条件成熟时,才会有购买行为;而选择其他选项的人群基本不会有购买行为。

这是定性调研结果的经验修正值,如果有这样定量修正值对新产品调研的结果进行修正,公司就需要重新考虑该产品的上市问题了。

 

小贴士:我只能说如果你还想开展市场调研活动,80%、30%是两个值得大家记住的经验数据。