三、散布图及实施案例

(一)相关的概念

变量之间常常是相互联系的,它们之间存在一定的关系,通常有两种类型:

一种类型:变量间的关系是确定的,总可以用某种函数来表达。例如:圆的面积S=πr2,这里变量r和S间的关系是完全确定的,称之为函数关系。

另一种类型:变量间有某种关系,但又不是确定性的关系,称之为相关关系。

可以看出,函数关系和相关关系是两种不同的关系,但它们之间又没有严格的界限。在理论上存有函数关系的变量,由于实验和测量的误差,数值会有不确定性;而相关变量间本来是没有确定性关系的,但在特定条件下,从统计意义上看,它们又是存在某种函数关系的。

在变量存在相关关系时,又有两种情况:

第一种,这些变量都是随机变量,彼此间地位相同,任一个变量既可以做因变量又可以做自变量。这类问题可以用相关分析解决。

第二种,某些变量是可以控制和测量的非随机变量,称之为自变量,另一个变量与它们有关,这是不可控的,是随机变量,称之为因变量。这里因变量与自变量地位不同,不能互换。这类问题我们用回归分析解决。

相关分析主要用来衡量变量间线性相关的密切程度;回归分析则是定量地给出变量间变化规律,它不仅能得提供变量相关关系的经验公式(回归方程),还可以判明所建立的回归方程的有效性。在方程有效的前提下,可以利用方程做预测和控制,并了解预测和控制的精度。这里只讨论散点图与相关分析,回归分析请参考其他书。

变量之间存在的关系,有下列几种情形:

(1)完全相关关系:这种关系一般可用一个不变的数学公式来表达。

(2)相关关系:变量之间存在密切关系,但又不能由一个(或几个)变量的数值精确地求出另一变量的数值,称这类变量的关系为相关关系。

(3)不相关:事物之间没有关系。

(二)散布图定义及用途

描述两个因素之间关系的图形称为散布图,又叫相关图。

散布图的用途主要有以下两点:

(1)用来发现和确认两组数据之间的关系并确定两组相关数据之间预期的关系。

(2)通过确定两组数据、两个因素之间的相关性,有助于寻找问题的可能原因。