既然系统地学习统计学,对大多数人来说,都是一种负担。那么,我给大家的建议是,从学习和应用统计学函数的经典模型开始,如果能记住这些经典函数的限制条件和应用场景,对很多统计学的初级应用者来说,是一劳永逸的事情。
别让销售波动侵蚀了你的库存和资金——进货或出货均衡性的评估模型
第30届奥运会上,孙杨在1500米的自由泳竞赛中破世界纪录。优异成绩的取得,除了源于自身天赋和勤奋外,科学的训练及比赛方法也是其一举摘金的重要因素。据说,在1500米的15段100米比赛中,除了出发和冲刺两段100米外,孙杨基本能够将13段100米的游泳用时时差控制在0.5秒以内。因为孙杨每100米的用时时差非常均衡,这让他能够更合理地控制比赛节奏、分配体力,是后程的发力提供了重要保证。
在销售过程的监控中,销售的均衡性和稳定性一直困扰着经销商和厂家。波动过大的波峰和波谷对资金与库存的隐性侵蚀,让许多经销商和厂家苦不堪言。这种无规律的波动对资金和库存的影响,在“经销商算账的六个误区”中也曾有表述。在分阶段进货后,库存的均衡性到底有没有好转呢?在经典的统计函数模型中,有一个重要方法可以测算日均或月均进货总体标准差。
总体标准差主要是监控日进货、月进货量与日平均进货量、月平均进货量的差异,总体标准差值越大,说明进货的均衡性越差;差值越小,说明进货的均衡性越好。均衡性的进货监控分为两步:
第一步,确认监控的时间段,调取该时间段内等量时间长度的进销货数据,并计算调取数的算术平均数 ,原则上调取的数据样本数n≥30,有利于减少误差。
第二步,总体标准差的公式为:
σ=
总体标准差的大小代表了等量时间长度的进销货数据与平均进销货数据的偏差情况。
下表(表10-3)为某公司6、7月份的日出货数据(单位:万元),6月份仍然采取月底销售达成的考核办法。7月份开始执行对经销商分时间段考核进货进度的新政策,即10日、20日、月底三个时间点作为月度进货进度的考核节点,并执行对应的激励政策。请确认7月份均衡进货是否比6月份有所好转?
表10-3 某公司6、7月份的日出货数据
月份 |
1日 |
2日 |
3日 |
4日 |
5日 |
6日 |
7日 |
8日 |
9日 |
10日 |
11日 |
12日 |
13日 |
14日 |
15日 |
6月 |
357 |
277 |
262 |
382 |
498 |
128 |
362 |
389 |
634 |
610 |
516 |
990 |
651 |
626 |
331 |
7月 |
255 |
223 |
255 |
183 |
229 |
346 |
386 |
361 |
420 |
276 |
276 |
354 |
461 |
501 |
439 |
月份 |
16日 |
17日 |
18日 |
19日 |
20日 |
21日 |
22日 |
23日 |
24日 |
25日 |
26日 |
27日 |
28日 |
29日 |
30日 |
31日 |
6月 |
514 |
567 |
205 |
531 |
540 |
299 |
160 |
784 |
690 |
908 |
899 |
716 |
524 |
1046 |
1102 |
/ |
7月 |
396 |
381 |
405 |
412 |
588 |
539 |
476 |
383 |
546 |
407 |
368 |
452 |
679 |
669 |
619 |
538 |
第一步,监控以月为单位(6月、7月)的日出货均衡性,6月日出货平均数 =550万元,7月日出货平均数
=414万元。
第二步,
6月日出货总体标准差:
σ= =257
7月日出货总体标准差:
σ= =127
7月日出货波动明显小于6月日出货,即使7月比6月多出了1天,7月按时间节点(10日、20日、月底)考核的方式,对均衡出货有一定的作用。
预测客户愿意掏多少钱来买单——客均单价的经典模型
对很多营销人员来说,经常会计算客单价。用算术平均数计算的结果,代表的是有限样本的历史平均水平,对没有参与计算的样本没有评估价值,对未来客均单价的走向也没有太大的引导价值,这是用算术平均数计算客均单价的最大缺陷。统计函数里有一个经典模型,专门用来计算、评估、指导客均单价的趋势,称之为“区间估计值”模型。
第一步,计算抽样平均误差:
在已经形成销售的订单中,随机抽取一定数量(抽取的销售订单数≥30为佳)的历史订单,计算这些订单额的算术平均数 ,并计算这些订单销售额的样本标准差σ(具体算法参照“进货或出货均衡性的评估模型”)。区别在于:进货或出货均衡性的评估模型是总体标准差,所以分母〈自由度〉为n;而客均单价是样本标准差,所以分母(自由度)为(n—1)。
通过样本标准差计算抽样平均误差μ(抽样平均误差是指抽取的这些销售订单的平均值和所有订单平均值的误差程度)。如果是重复抽样,平均误差的程度要用样本标准差除以样本单位数的平方根;在不重复抽样的情况下,平均误差程度等于重复抽样平均误差乘以修正因子 (N是整体订单数,n是抽取的订单数)。由于销售订单总数N一般情况下,都是趋近于无穷大,修正因子
无限接近1,所以一般意义上,不重复抽样和重复抽样的平均误差都用样本标准差除以样本单位数的平方根。
第二步,确认抽样平均误差的修正值:
虽然样本与总体平均值的误差程度已经被数据量化出来了(重复抽样和不重复抽样都采用样本标准差除以样本单位数的平方根),由于样本数据毕竟代替不了总体数据,所以我们还需要对误差程度给予一个修正值。由于客单价销售数据一般都属于正态分布数据,所以可以根据概率保证、确认概率度,也就是平均误差的修正值z。我们一般使用的概率保证是90%或者95%,90%概率保证对应的误差修正值为1.64,95%概率保证对应的误差修正值为1.96,不习惯查《正态分布概率表》(参见本书附表二)的人,可以记住这个两个对应值。
第三步,对计算出来的订单额算术平均值 进行区间修正:
根据得出的抽样平均误差和误差修正值,得到整体修正值Δ=zμ,可依次计算区间估计值的上下限:[ —μ×z,
+μ×z]。
为评估某门店客均单价的实际情况,我们采取重复抽样的方式,共抽取销售订单样本64张,每张订单金额如下表。求在90%的概率保证下,请确认门店人均消费额区间估计值的范围。
表10-4销售订单样本(单位:元)
635.01 |
2 |
205 |
213 |
271 |
219 |
219 |
423 |
205 |
205 |
205 |
219 |
66.7 |
14 |
142 |
189 |
118 |
209 |
102 |
219 |
62.7 |
1367.82 |
90 |
134 |
205 |
639 |
213 |
44 |
198 |
213 |
1638.02 |
134 |
138 |
185.61 |
205 |
205 |
213 |
148 |
213 |
213 |
134 |
205 |
390.01 |
102 |
96 |
179.61 |
175.61 |
39 |
2 |
209 |
17 |
69.7 |
90 |
219 |
155.61 |
213 |
189 |
142 |
219 |
213 |
217.3 |
185.61 |
138 |
171.61 |
第一步,销售订单的算术平均数 =ΣX/n=223.62元,样本标准差σ=258.78,
在重复抽样的情况下,订单抽样的平均误差μ=σ/ =32.35。
第二步,在90%的概率保证下,误差修正值z=1.64。
第三步,在90%的概率保证下,客均单价的浮动范围在[223.62—53.05,223.62+53.05],即[170.57元,276.67元]。
可以预测,该门店90%的销售订单均落在[170.57元,276.67元]之间。
哪些因素与我们的销售结果有关——影响销售结果的因素分析模型
在很多销售分析中,营销人员都试图找出影响销售结果的原因。但是在实际操作中,要弄清这些对销售结果产生的影响、量化这些影响的大小,营销人员一直都没有找到好办法。本节所要介绍的,正是要找出影响销售结果的因素并对其量化,以指引营销人员重点关注那些对销售结果产生影响的指标。在统计学中,对销售结果产生影响的因素分析方法推荐采用相关分析模型,虽然相关分析的应用范围非常广泛、种类庞杂,但我们建议初学者仅使用单相关分析系数r,对销售结果与影响因素进行相关程度的判断。
确认两组数据是否存在线性关系,要凭r值计算结果来评判:大多数情况下,1>∣r∣>0,当r>0时,我们称两组数据正相关;r<0,我们称两组数据负相关;∣r∣=1时,说明两组数据完全线性相关。r=1时,称为完全正相关;r=—1时,称为完全负相关。
我们将影响销售结果的因素分析模型分为四步:
第一步,确认与销售结果相关的因素,并将销售结果形成期间的销售数据与影响因素数据一一对应。
第二步,通常以销售结果数据为因变量,影响因素数据为自变量,分别求出两组变量的平均数 、 ,并依据样本相关系数的公式求出两组样本数据的相关系数r(总体相关系数在统计学里用ρ表示),初步判断两者是否存在线性相关关系。
第三步,在现实的销售分析中,由于销售数据和影响因素数据都是随机抽取的样本数,样本容量越小,可信度越差,因此需要对相关系数进行检验。由于相关系数显著性的检验稍显复杂,通常涉及总体相关系数ρ等于0或者不等于0、某个特定数值的检验,这里介绍的经验是,可以只对总体相关系数ρ=0时,两者是否存在线性相关性进行t检验。
t检验主要是对r的t值进行计算,标准公式如下:
第四步,根据给定的概率保证和自由度(n-2),查找《t分布临界值表》(参见本书附表三)中对应的临界值tα/2。若计算出来的t值大于等于tα/2,即︱t︱≥tα/2,r值代表的相关系数,即被测试的影响因素数据与销售数据相互影响的程度。若︱t︱<tα/2,表明销售结果数据与影响因素数据两者之间不存在线性相关关系。
为测算促销力度的大小是否对销售结果产生影响,某经销商将历年开展的29次门店促销投放的资源和销售结果进行相关性分析,销售结果与投放资源的对应表格(表10-5)如下(单位:元)。请确认,在95%的概率保证下,促销力度的大小是否对销售结果产生影响?
表10-5 29次促销活动信息表
相关项目 |
第1次 |
第2次 |
第3次 |
第4次 |
第5次 |
第6次 |
第7次 |
第8次 |
第9次 |
第10次 |
投放费用 |
5794 |
36000 |
7548 |
82775 |
13926 |
13191 |
62200 |
29000 |
4900 |
38506 |
销售金额 |
245472 |
799000 |
107826 |
1655506 |
506000 |
1431183 |
3110000 |
580000 |
70000 |
855684 |
相关项目 |
第11次 |
第12次 |
第13次 |
第14次 |
第15次 |
第16次 |
第17次 |
第18次 |
第19次 |
第20次 |
投放费用 |
12916 |
35400 |
2800 |
11750 |
24801 |
13650 |
9264 |
30900 |
9222 |
1200 |
销售金额 |
468000 |
883500 |
70000 |
470000 |
1289928 |
455000 |
115804 |
760100 |
184436 |
30000 |
相关项目 |
第21次 |
第22次 |
第23次 |
第24次 |
第25次 |
第26次 |
第27次 |
第28次 |
第29次 |
投放费用 |
12000 |
3663 |
24737 |
3106 |
1139 |
23315 |
21049 |
12240 |
16000 |
销售金额 |
270000 |
504200 |
1102000 |
90694 |
10137 |
466300 |
601174 |
612000 |
531100 |
第一步,影响因素与销售结果一一对应的数据,整理结果如表(表10-5)。
第二步,历次投放费用的平均值 ≈19414元, ≈630174元,且依据标准公式,两者的样本相关系数r=0.7917。
第三步,对相关系数r的t值进行检验,依据公式,则t=6.7342。
第四步,当概率保证为95%,即显著水平α=1-95%=5%,因为销售数据的分布一定属于双侧检验,所以自由度=n-2=29-2=27时,可查《t分布临界值表》,tα/2=2.052。因为t值6.7342远大于临界值2.052,所以我们认为,投入费用的多少一定程度上会对销售金额产生影响。
小贴士:与销售结果有关的影响因素数据是否存在影响关系,除了计算r值,还要通过t值的检验,即使没有通过t检验,只能说明两组数据不存在线性相关性,不能排除两者存在其他关系。
价格和销量影响销售额的变化——销售构成分析模型
商品价格上涨是必然趋势;抑或由于临时促销的需要,将价格暂时下调。无论是涨价还是降价,销售量都会变化,营销人员最希望知道,这些变化在多大程度上影响着我们的销售结果,尤其是希望知道这些变化对销量影响的量化数据分别是多少,这也是量化营销对营销界最重要的贡献。综合指数体系法,通过综合指数模型将销售额变化的因素逐一分解、量化,让我们对销售变化洞若观火、一目了然。
在测算销售额变化的因素分析上,德国经济统计学家E.Laspeyres和H.Paasche各有一套质量和数量的指标体系,对销售额的变化进行指标监控,我们称之为拉氏指数和帕氏指数,综合指数体系法正是在此基础之上发展演变而来。综合指数体系法计算模型分为三步:
第一步,将价格变化前后,销售量和销售额的变化数据列表比较。
第二步:将价格变化后的销售额与价格变化前的销售额对比,并按如下指数体系进行分解(p0:变化前价格,q0:变化前的销量,p1:变化后的价格,q1:变化后的销量):
①
∑p1q1—∑p0q0=(∑q1p0—∑p0q0)+(∑p1q1-∑q1p0)②
第三步,则公式①代表的是销售额与影响因素变化的百分比,公式②代表百分比的变化引起销售额绝对值的变化。
某公司6种商品降价促销前后销售量变化数据,参看表(表10-6)。请确认价格和销量变化各为销售额增长做出多大贡献?
第一步,调价前后,销售额和销售量变化数据列表(表10-6)如下:
表10-6 调价前后,销售额和销售量变化数据
商品类别 |
商品价格(单位:元) |
销售量(单位:只) |
销售额(单位:万元) | |||||
p0 |
p1 |
q0 |
q1 |
p0 q0 |
p1 q1 |
p0 q1 |
p1 q0 | |
A |
9.89 |
7.2 |
581106 |
1084363 |
574.71 |
780.74 |
1072.44 |
418.40 |
B |
9.69 |
8 |
369914 |
505726 |
358.45 |
404.58 |
490.05 |
295.93 |
C |
14.59 |
9.5 |
692750 |
2539853 |
1010.72 |
2412.86 |
3705.65 |
658.11 |
D |
7.79 |
6.58 |
193777 |
243020 |
150.95 |
159.91 |
189.31 |
127.51 |
E |
11.59 |
9.98 |
1649617 |
804709 |
1911.91 |
803.10 |
932.66 |
1646.32 |
F |
18.89 |
12.98 |
172824 |
816525 |
326.46 |
1059.85 |
1542.42 |
224.33 |
合计 |
4333.21 |
5621.04 |
7932.52 |
3370.59 |
备注:p0:变化前价格,q0:变化前的销量,p1:变化后的价格,q1:变化后的销量。
第二步,按综合指数体系法的公式,将影响销售额的价格和销量进行拆分和解构:
5621.04/4333.21=(7932.52/4333.21)×(5621.04/7932.52)
5621.04—4333.21=(7932.52—4333.21)+(5621.04-7932.52)
即:
129.72%=183.06%×70.86%
1287.83=3599.31+(—2311.48)万元
第三步,由于6种商品的销量增长83.06%,使销售额增加了3599.31万元;由于价格下调29.14%,使销售额下降了2111.48万元。两者共同作用的结果,销售额上涨了29.72%,共增加了1287.83万元的销售额。
销售任务到底要怎么分——销售预测的经典模型
在销售量化上,在公司总任务层层下达,没有讨价还价的余地的情况下,很多销售人员就在月度任务上动脑筋。一般的规律是“前少后多”。即上半年少分点,把该拿的和能拿的钱先拿了,后半年多分点,只要上半年的奖金和提成到手,谁还管那么多。这导致很多销售人员在任务达成上急功近利、手法短视的倾向严重。到底月度任务怎么分,多少比例才能让下达任务和接受任务的双方都满意,不违背市场发展的内在规律,对市场造成严重的伤害呢?
销售预测的经典模型——移动平均趋势剔除法,从方法上消除了由于季节波动引起的差异和随机因素带来的影响,并通过季节比率平均数消除了随机取数的影响。这比单纯地“拍脑袋”和依靠上年的月度销售比例下达本年度的销售比例更加合理。当然该模型的限制性条件是,它并不适合任何类型数据,而要考虑预测数据的历史趋势。有的数据具有明显的水平趋势;有的数据具有明显的上升或下降趋势,移动平均趋势剔除法只适合具有明显上升(或下降)的长期趋势的数据类型,并根据结果推算正常的月度比例。
移动平均趋势剔除法分为三步,具体步骤如下:
第一步,通过中心化移动平均数消除了各月(季)之间,因季节因素引起的差异和随机因素的影响。取最近不少于三个周期(三年)的月度销售数据,计算中心化的移动平均数。一年12个月,中心化移动平均数的项数也取定为12。中心化移动平均数的计算公式如下:
中心化移动平均数Tt
=(0.5×Xt-6+Xt-5+……+Xt-1+Xt+Xt+1+……+Xt+5+0.5×Xt+6)/N
备注:Xt代表月度销量,t=7、8……,N代表一个周期的长度。
第二步,消除随机取数的影响。计算季节比率和季节比率的平均数,以消除随机取数的影响。季节比率和季节比率平均数的计算公式如下:
季节比率=月度销量/月度中心化移动平均数=Xt/Tt
季节比率平均数Sj=(Xt/Tt+Xt+12/Tt+12)/2
备注:t=j,N代表一个周期的长度。
第三步,通过调整系数修正月度比例。计算调整系数并对季节指数进行修正,然后得出标准的月度占比指标。
调整系数=N/∑Sj
季节指数Sj*=调整系数×Sj
月度占比Mj=季节指数/N=Sj*/N
备注:N代表一个周期的长度。
某公司2007年到2009年销售数据如下,具体销售数据见下表(表10-7),对月度占比进行测算。
表10-7 某公司2007年到2009年销售数据(单位:万元)
年月 |
销售总额Xt |
中心化移动平均数Tt |
季节比率Xt/Tt |
季节比率平均数Sj |
季节指数Sj* |
月度销售占比Mj |
2007年1月 |
10871 |
|||||
2007年2月 |
1811 |
|||||
2007年3月 |
7564 |
|||||
2007年4月 |
9151 |
|||||
2007年5月 |
10286 |
|||||
2007年6月 |
11351 |
|||||
2007年7月 |
10081 |
12008.25 |
0.839506173 |
0.842131 |
0.839938 |
7.00% |
2007年8月 |
13119 |
11989.91667 |
1.094169406 |
1.067981 |
1.065201 |
8.88% |
2007年9月 |
15049 |
12248.54167 |
1.228636062 |
1.263394 |
1.260105 |
10.50% |
2007年10月 |
14561 |
12571.08333 |
1.158293173 |
1.178727 |
1.175658 |
9.80% |
2007年11月 |
18529 |
12887.25 |
1.437777648 |
1.388393 |
1.384779 |
11.54% |
2007年12月 |
23224 |
13164.58333 |
1.764127235 |
1.607228 |
1.603044 |
13.36% |
2008年1月 |
7875 |
13349.91667 |
0.589891323 |
0.458606 |
0.457412 |
3.81% |
2008年2月 |
4367 |
13435.875 |
0.325025352 |
0.311575 |
0.310764 |
2.59% |
2008年3月 |
11215 |
13567.125 |
0.82663055 |
0.840467 |
0.838279 |
6.99% |
2008年4月 |
13241 |
13740.5 |
0.963647611 |
0.990106 |
0.987529 |
8.23% |
2008年5月 |
13784 |
13815.625 |
0.997710925 |
0.991597 |
0.989016 |
8.24% |
2008年6月 |
14509 |
13703.70833 |
1.058764507 |
1.091111 |
1.088271 |
9.07% |
2008年7月 |
11371 |
13460.70833 |
0.84475495 |
∑Sj=12.03131 |
∑Sj*=12 |
|
2008年8月 |
13892 |
13334.70833 |
1.041792565 |
|||
2008年9月 |
17426 |
13423.70833 |
1.29815097 |
|||
2008年10月 |
16345 |
13630.375 |
1.199159964 |
|||
2008年11月 |
18548 |
13852.04167 |
1.339008389 |
|||
2008年12月 |
20519 |
14147.83333 |
1.450328083 |
|||
2009年1月 |
4748 |
14505.66667 |
0.327320358 |
|||
2009年2月 |
4470 |
14993.75 |
0.298124218 |
|||
2009年3月 |
13248 |
15507.375 |
0.854303194 |
|||
2009年4月 |
16168 |
15904.54167 |
1.016564975 |
|||
2009年5月 |
16177 |
16415.29167 |
0.985483556 |
|||
2009年6月 |
19215 |
17103.45833 |
1.123457001 |
|||
2009年7月 |
15253 |
|||||
2009年8月 |
21724 |
|||||
2009年9月 |
21921 |
|||||
2009年10月 |
21382 |
|||||
2009年11月 |
25769 |
|||||
2009年12月 |
29814 |
第一步,计算中心移动平均数,以消除季节因素和随机因素造成的误差,以2007年7月为例。
中心化移动平均数T7
=(0.5×Xt-6+Xt-5+……+Xt-1+Xt+Xt+1+……+Xt+5+0.5×Xt+6)/N
=(0.5×10871+1811+7564+9151+10286+11351+10081+13119+15049+14561+18529+23224+0.5×7875)/12
=12008.25
其他中心化移动平均数以此类推,所得结果展现在Tt列。
第二步,通过计算季节比率和其平均数,消除随机取数的影响,以2007年7月数据为例。
季节比率=月度销量/月度中心化移动平均数
=X7/T7
=0.839506173
其他季节比率以此类推,计算结果展现在Xt/Tt列。
季节比率平均数S7
=(X7/T7+X7+12/T7+12)/2
=(0.839506173+0.84475495)/2
=0.842131
其他季节比率平均数以此类推,计算结果展现在Sj列。
第三步,计算季节指数并推算月度销售占比。
先求调整系数
=N/∑Sj
=12/12.03131
=0.9974
通过调整系数求出季节指数,仍以2007年7月数据为例:
S7*=S7×调整系数
=0.842131×0.9974
=0.839938
其他季节指数数据以此类推,计算结果展现在Sj*列。
最后,得出月度销售占比Mj,仍以2007年7月数据为例:
月度占比M7
=S7*/N
=0.839938/12
≈7.00%
其他月度占比数据以此类推,计算结果展现在月度销售占比Mj列。
故该公司未来月度销售占比数据,可以参考以下数据:
表10-8 未来月度销售占比数据
月份 |
1月 |
2月 |
3月 |
4月 |
5月 |
6月 |
7月 |
8月 |
9月 |
10月 |
11月 |
12月 |
销售占比 |
3.81% |
2.59% |
6.99% |
8.23% |
8.24% |
9.07% |
7.00% |
8.88% |
10.50% |
9.80% |
11.54% |
13.36% |
图形表示如下:
图10-2 月度销售占比图