数值型的数据可以分为连续和离散两个类别。
这两种数据各自组成不同的分布,离散分布是离散数据而成的,连续分布则是连续数据而成。
离散数据是其数值只能用自然数,整数,计数单位等描述的数据,其数据的取值是不连续的,每个数值之间都有明确的间隔。
王家卫导演的电影《花样年华》在海内外获奖无数,同时男女主角的精彩演出,更让各大影评纷纷赞赏。
《花样年华》讲的是一个含蓄的爱情故事,大多数的电影片段都靠男女主角的语言,肢体表情来展现和推进,因此两人独处的画面频频出现。这样的镜头之中,对于人数,就只有2个数值,不会存在1.5或者2.7这样的数值。因为人数只有2个,不会有半个梁朝伟,又或者0.75个张曼玉的存在。这个数据就是离散数据了。
连续数据是指在一定区间内可以取任意值。相邻的数值可作无限分割。
《花样年华》这部典型的王家卫作品,边拍边构思,并没有一个完整的剧本。王家卫最终把拍摄的所有片段剪成一个简单而充满内涵的故事。不够当中也剪掉了一些精彩片段,并没有被安排上映。其中男女主角在房里跳舞这一段被剪掉了,甚是可惜。跳舞过程中,两人的距离渐渐拉近,甚至近到0.5米,不过更加精准的话,可以是0.53米,甚至延伸为0.535125米,能够去到多少位小数数字,一切取决于量度的精度有多少。这样的数值无限分割下去,就是连续数据了。当然,《花样年华》这个故事的结局很是遗憾,两人的距离纵使再近,都只是一个连续数据,而无法为零。
其他典型的连续数据,如身高,既可以是183厘米,也可以是183.15厘米,甚至延伸为183.151712厘米。
而数据在统计图中的形状,则叫做它的分布。因此离散数据的形状则为离散分布,连续数据的形状就是连续分布。
离散分布和连续分布的图示
图3-1 离散分布
图3-2 连续分布
很多计算安全库存的公式,都是基于正态分布演化而来的。而正态分布是属于连续分布的一种。但并非所有分布都是属于正态分布,那么就说明了安全库存的计算存在不适应性,因为需求的情况不服从正态分布的话,计算就是毫无意义。
区分连续数据还是离散数据其实很简单。离散就是度量“可数事物”的多少,而连续则是度量“不可数事物”的多少。