基于spss的相关性分析(correlationanalysis) ⽬录
相关关系从不同的⾓度有不同的分类⽅式。⾸先是按照相关关系强度划分:完全相关,弱相关和不相关。也能按照相关关系的⽅向分类:正相关和负相关。以上两种是最常⽤的分类⽅式。除此之外,还有两种分类⽅式,需要重点介绍。
按照相关关系形态划分,可以分为线性相关和⾮线性相关。当⼀个变量的值发⽣变化时,另外⼀个变量也发⽣⼤致相同的变化。在直⾓坐标系⾥,两个变量的观测值的分布⼤致在⼀条直线上,那么这两个变量之间的相关关系是线性关系;如果在直⾓指标系内,两个变量的观测值分布是⼀条曲线,那么它们之间的相关关系是⾮线性相关。
还有⼀种相关关系的划分原则是按照变量的个数划分,可以分为单相关,复相关和偏相关。单相关是两个变量之间的关系,这两个变量⼀个是因变量,⼀个是⾃变量。两个变量的相关关系分析也被称为⼆元变量相关分析。复相关是指三个或三个以上的变量之间的关系,即⼀个因变量对两个或两个以上⾃变量的相关关系。偏相关综合了单相关和复相关的特点,当⼀个变量与多个变量相关,但是只关⼼其中⼀个因变量与⾃变量的关系,需要屏蔽其他因变量对⾃变量的影响,这样的相关关系就叫做偏相关。
⼆、⼆元变量相关系数
中国关系网⼆元变量的相关分析计算得到的是两个变量之间的相关系数。具体⽽⾔,两个定距和定⽐变量间的相关性⽤Pearson(⽪尔逊)相关系数来判定,这是参数检验的⽅法;两个定序或定类变量间的相关性⽤Spearman等级相关系数和Kendall’s tau-b等级相关系数来判定,这两种⽅法属于⾮参数检验。
1、Pearson简单相关系数
⽪尔逊简单相关,也称积差相关。是以英国统计学家⽪尔逊的名字命名的计算线性相关的⽅法,⽤于对定距或定⽐变量的相关性探索。两个变量之间的⽪尔逊相关系数定义为两个变量之间的和的商:
⽪尔逊相关系数的计算公式:
化简:
使⽤条件:
两个变量都是由测量获得的连续型数据,即等距或等⽐数据。 两个变量的总体都呈正态分布或接近正态分布,,⾄少是单峰对称分布,当然样本并不⼀定要正态。
必须是成对的数据,并且每对数据之间是相互独⽴的。
两个变量之间呈线性关系,⼀般⽤描绘散点图的⽅式来观察。
联想100分学校2、Spearman等级相关系数
Spearman相关系数是由英国统计学家Spearman在Pearson相关的基础上剔除的等级相关系数的计算
⽅法,⽤于对定类或定序变量的相关性检验,可以看作是Pearson相关系数的⾮参数检验,因为它依据的是数据的秩⽽⾮数据的实际值。Spearman相关系数的取值范围也是在-1到+1之间,绝对值越⼤相关性越强,正负号表⽰相关的⽅向。
Spearman相关系数计算公式:
其中:
Ui是变量X排序后的秩;
Vi是变量Y排序后的秩;
大龙明权n是样本容量。
系数特点:
如果两变量正相关较强,则它们秩变化同步,D值较⼩,等级相关系数趋于1;
如果两变量负相关较强,则它们秩变化相反,D值较⼤,等级相关系数趋于-1;
如果两变量相关性弱,它们秩变化互不影响,D值趋于中间值,等级相关系数趋于0;
3、Kendall’s tau-b等级相关系数
Kendall’stau-b等级相关系数也是⽤于对定序变量的相关程度的度量,也属于⾮参数检验的范畴。它利⽤变量秩数据来计算⼀致对数⽬U和⾮⼀致对数⽬V。
当两个变量具有较强的正相关关系时,⼀致对数⽬U较⼤,⾮⼀致对数⽬V较⼩;当两个变量具有较强的负相关关系时,⼀致对数⽬U 较⼩,⾮⼀致对数⽬V较⼤;当两个变量相关性较弱时,⼀致对数⽬U和⾮⼀致对数⽬V⼤致相等。
Kendalltau-b相关系数定义为:
其中,U为⼀致对数⽬;
V为⾮⼀致对数⽬;
n为样本容量。
系数特点:
第一物联网如果两变量正相关性强,秩变化同步,则U应该较⼤,V应该较⼩,趋于1;
中国青年运动的时代主题
如果两变量负相关性强,秩变化相反,则U应该较⼩,V应该较⼤,趋于-1;
如果相关关系弱,则U,V⼤致相等,趋于0;
三、基于spss的具体操作
举例:通过分析三⼗个样本地区的家庭经营收⼊x2与⾐着⽀出y2关系,判断其具有相关性。(这⾥由常理知识就可以判断出两者之前肯定是具有相关性的)
选择【分析】-【相关】-【双变量】菜单-勾选全部相关系数N、K、S-【选项】勾选平均值,叉积偏差和协⽅差
结果分析:
1、描述统计。显⽰均值和标准差,以及纳⼊计算的个案数⽬。
2、相关性分析。Pearson相关性是以交叉表格的形式呈现的。其中相关系数P为0.387,说明这两个变量是正相关的。且显著性P值sig为0.034⼩于0.05,所以认为两个变量具有显著相关性。
牙齿模型
3、⾮参数相关性分析(K、S相关性)。 所得相关系数分析同上。
最终三种结果的具体数据虽然不同,但是它们的结论是⼀样的。
四、参考⽂献:
[1]⽣活统计学:SPSS分析技术:两变量的相关分析;对于薪⽔,学历与⼯作经验,哪个更重要?
[2]⽣活统计学:数据分析技术:相关关系分析;说“你好我也好”,这不⾜够