自由读 — 市场调研——不得不提的三个数据处理方法

所有市场营销专业出身的人，都系统地学习过市场调查这门课程，即使非营销专业出身的营销人员，也大都参与执行过公司组织的各类市场调查工作，众多的消费者更是或多或少地接受过各式各样的市场调查。所以说，市场调查其实离我们普通人的生活并不远。作为销售管理者，即使不能成为市场调研的专家，至少也应该对这门工具有大致的了解。

因为市场调研涉及的知识点和内容比较多，尤其涉及到统计学的知识，比较复杂，需要系统的学习，所以本节对市场调研的介绍，主要侧重易于掌握的、涉及数据类型的重要知识点的介绍，其他需要统计学知识做铺垫的数据分析方法暂不介绍。

重新认识平均数

在市场调研中，通过对平均数的计算，在评估对象的整体水平、体现样本的分布趋势上都有广泛应用。但在大多数人的观念中，平均数就是数字之和除以个数，认识更多一点的只知道加权平均数的概念和使用。这里，我们要重新认识平均数。

平均数分为数值平均数和位置平均数。数值平均数主要包括算术平均数、调和平均数、几何平均数等；位置平均数主要包括众数、中位数、分位数等，我们只介绍前两位的平均数。

（一）算术平均数

这是应用最广、最容易掌握的平均数，处理数据的限制性条件也最少，分为简单算术平均数和加权算术平均数。

以某企业各区域月销售额和实际门店数量占比为例，求区域销售的简单算术平均数和加权算术平均数。

表7-7 某企业各区域月销售额和实际门店数量占比

区域	月销售额	门店数量占比
区域A	500万元	20%
区域B	200万元	25%
区域C	400万元	10%
区域D	600万元	22%
区域E	250万元	18%
区域F	550万元	5%

简单算术平均数

＝（样本1＋样本2＋样本3＋……＋样本n）／n

＝（500万元＋200万元＋400万元＋600万元＋250万元＋550万元）／6

≈416.7万元

加权算术平均数

＝样本1×权数1＋样本2×权数2＋样本3×权数3＋……＋样本n×权数n

＝500万元×20%＋200万元×25%＋400万元×10%＋600万元×22%＋250万元×18%＋550万元×5%

＝394.5万元

小贴士：在统计上，简单算术平均数比加权算术平均数应用更广，简单算术平均数主要用于处理未分组的原始数据；而加权算术平均数只能应用于分类型的分组资料。简单算术平均数可以看做是加权算术平均数的特例。

（二）调和平均数

对于无法穷尽样本个数的调研，需要确认整体样本平均数时，调和平均数就可以发挥作用了。当然调和平均数也分为简单调和平均数和加权调和平均数两种。依据下表（表7-8），求6个区域的均单销售额。

表7-8 各区域抽样均单销售额和销售总额

区域	抽样均单销售额	销售总额
区域A	2000元	500万元
区域B	1000元	200万元
区域C	1500元	400万元
区域D	2500元	600万元
区域E	800元	250万元
区域F	1100元	550万元

在这里，权数就是区域总销售额，当区域总销售额相等时，可采用简单调和平均数。因为权数不等，故采用加权调和平均数。

加权调和平均数

＝

≈25000000元／(2500＋2000＋2667＋2400＋3125＋5000)

≈1413元

小贴士：加权调和平均数主要用于在已知代表变量值和权数（总量值）的条件下，求整体变量值的平均数情况。当总量值相等时，即权数相等时，加权调和平均数和简单调和平均数相等。

（三）众数

众数就是在所有调研样本中出现次数最多、频率最高的标志值，如商品的交易价格可能不断变换，但是成交次数最多的那个价格就是众数价格；经销商可能对公司的很多方面都有不满，但是那个提到和投诉最多的问题，就是众数投诉项。理论上众数确认的方法非常简单：在样本中找出次数最多和频率最高项，就是该样本的众数项。需要重点介绍的是组距数列的众数确认。

组距式变量数列的众数确认分为两步，以某次调研的2500名消费者收入为例。

表7-9 消费者收入

年收入状况	消费者数（名）
10000元以下	34
10000~20000元	123
20000~30000元	157
30000~40000元	239
40000~50000元	401
50000~60000元	538
60000~70000元	318
70000~80000元	275
80000~90000元	205
90000~100000元	167
100000元以上	43

第一步,从样本中找出频数和频次最大的组：

显然，在这次消费者收入调研中，众数组是年收入在50000~60000元的消费者，共计538名。

第二步，依据与众数组相邻的两个组的频数，计算近似众数值。公式如下：

众数下限公式

＝众数组下限值＋ ×组间距值

或者，

众数上限公式

＝众数组上限值— ×组间距值

故众数值为：

＝50000元＋ ×10000元

≈53838元

此次2500名消费者年收入水平的众数值为53838元。

小贴士：需要注意的是：上下限众数计算公式，只适用分组等距的样本，或者频数最多的组与附近组的组间距相等。否则，该公式得出的结果就失去了意义。

（四）中位数

中位数，顾名思义，就是在样本数据中位于中间位置的数据。对于没有分组的样本数据，只需将数据按从大到小或从小到大的顺序排列后，就可以按以下方式确认中位数。

当样本数为奇数时，中位数＝X_（n_＋1_）/2

当样本数为偶数时，中位数＝（X_n/2＋X_（n/2_）＋1）／2

如 3、5、8、14、18、19、20、34、39、50、55、58、64、70。

当3~64时，共计13个数，中位数＝20；

当3~70时，共计14个数，中位数＝27。

分组式样本的中位数的计算稍显复杂，同时中位数的应用远不及众数广泛，这里就不再做介绍了。

小贴士：众数和中位数的出现，剔除了极端值对平均数的影响，相较于算术平均值来说，在反映数据的分布趋势上更有代表性。

调研分组中的交叉制表

在市场调研中，对于大量数据的处理，分组处理是比较理想的办法。被分到同一组的数据，应该是都具有同一个特征的数据。调研者必须知道，选择了一种分组方法，突出组内的某个共同特征，必然会掩盖其他的特征，分组特征的选择必须慎之又慎。在这里强调统计分组中的穷尽原则、互斥原则没有太多的现实意义，我在这里和大家分享的是在调研分组中的常用技巧：交叉制表，尽可能减少出现组内特征相互掩盖的问题。

交叉制表是对两个或两个以上变量间关系分析时常用的方法。它是对已经分到组内的数据进行二次分组，通过二次分组将目标调研者的信息更加集中，通常二次分组的特征是实现调研意图的关键问题。

假如某企业推出一款中高端价位的新产品，开展消费者购买意愿测试，共有1500名消费者接受测试，下表（表7-10）是消费者对测试反馈的结果。

表7-10 消费者测试结果

消费者选项	消费者态度（人）	消费者比例
肯定会购买	300	20%
极有可能会购买	750	50%
可能会/可能不会购买	225	15%
极有可能不买	150	10%
肯定不会购买	75	5%
总计	1500	100%

从选项结果来看，有70%的消费者极有可能或者肯定会购买新产品。对厂家来说，这是一个好消息，但是在交叉制表加入收入意图后，调查结果可能相反。

表7-11 考虑收入意图后的调查结果

消费者选项	月收入3000元及以下		月收入3000~5000元		月收入5000~8000元		月收入8000~12000元		月收入12000元以上		消费者比例	被调查人数
肯定会购买	36.14%	150	16.49%	80	19.61%	50	6.52%	15	4.35%	5	20%	300
极有可能会购买	48.19%	200	67.01%	325	49.02%	125	34.78%	80	17.39%	20	50%	750
可能会/可能不会购买	12.05%	50	7.22%	35	19.61%	50	32.61%	75	13.04%	15	15%	225
极有可能不买	2.41%	10	6.19%	30	7.84%	20	17.39%	40	43.48%	50	10%	150
肯定不会购买	1.21%	5	3.09%	15	3.92%	10	8.70%	20	21.74%	25	5%	75
总计	100%	415	100%	485	100%	255	100%	230	100%	115	100%	1500

在月收入8000元以上的人群中，仅有41.3%【（15＋80）／230】的人对新产品有购买意向；而在月收入12000元以上的人群中，这个比例更小，只有21.74%【（5＋20）／115】。

交叉制表的意义：通过加入影响调查结果的主要因素，可以更准确地把握目标人群的需求。

小贴士：绝大多数的市场调研分析，都是在交叉制表的基础上演变的，即使采用了复杂的数理分析方法计算，也都是以交叉制表为重要组成部分，它能够反映出很多问题。但是，很多时候取决于你是否加入了一个有创意的意图项。

对定性结果的定量修正

我们在日常市场调研中，发现大量的定性描述的选项，比如表7-10就是一个非常典型的例子。定性选项分为：肯定会购买；极有可能会购买；可能会/可能不会购买；极有可能不买；肯定不会购买。

因为有定性的描述，很多市场调研的统计人员，会完全按照被调研对象的选项，选择市场策略。实际上，很多消费者自己都不知道需要什么。所以消费者的选择，很多时候都会打折扣。根据被调研对象选择结果和实际行动之间的关联，统计后发现，在一些通用的定性结果上，可以采用修正值修正。

选择“肯定会购买”的人群，仅有80%的人会有购买行为；选择“极有可能会购买”的人群，也仅有30%的人在条件成熟时，才会有购买行为；而选择其他选项的人群基本不会有购买行为。

这是定性调研结果的经验修正值，如果有这样定量修正值对新产品调研的结果进行修正，公司就需要重新考虑该产品的上市问题了。

小贴士：我只能说如果你还想开展市场调研活动，80%、30%是两个值得大家记住的经验数据。