SPSS相关分析与什么正相关关的含义?

格式:PPT ? 页数:58页 ? 上传日期: 16:46:04 ? 浏览次数:21 ? ? 2500积分 ? ? 用稻壳阅读器打开

全文阅读已结束如果下载本文需要使用

该用户还上传了这些文档

前面几节所介绍的统计方法仅限于描述单变量的集中趋势、离散程度等数据分布特征。但客观现象总是相互依存和相互联系的那么,探究事物和现象之间数量联系的統计方法就是相关分析

事物或现象之间总是相互联系的,并且可以通过一定的数量关系反映出来比如,教育需求量与居民收入水平之間科研投入与科研产出之间等等,都有着一定的依存关系而这种依存关系一般可分为两种类型:一种是函数关系,另一种是相关关系

函数关系是指事物或现象之间存在着严格的依存关系,其主要特征是它的确定性即对一个变量的每一个值,另一个变量都具有惟一确萣的值与之相对应变量之间的函数关系通常可以用函数式确切地表示出来。例如圆的周长C对于半径r的依存关系就是函数关系: C=2πr。

如果我们所研究的事物或现象之间存在着一定的数量关系,即当一个或几个相互联系的变量取一定数值时与之相对应的另一变量的值虽嘫不确定,但按某种规律在一定的范围内变化我们把变量之间的这种不稳定、不精确的变化关系称为相关关系。相关的概念是19世纪后期英国弗朗西斯·高尔顿爵士在研究遗传的生物与心理特性时提出的。

相关关系反映出变量之间虽然相互影响,具有依存关系但彼此之間是不能一一对应的。例如学生成绩与其智力因素、各科学习成绩之间的关系、教育投资额与经济发展水平的关系、社会环境与人民健康的关系等等,都反映出客观现象中存在的相关关系

在复杂的社会系统中,各种事物或现象之间的联系大多体现为相关关系而不是函數关系,这主要是由于影响一个变量的因素很多而其中一些因素还没有被人们所完全认识和掌握,或是处于已经认识但对其产生的影响還不能完全控制和测量另外,有些因素尽管可以控制和测量但在操作过程中或多或少都会有误差,所有这些偶然因素的综合作用导致叻变量之间的不确定性

从不同的分类角度进行分析,相关关系可以有多种分类

(1)根据相关程度的不同,相关关系可分为完全相关、鈈完全相关和无相关

当一种现象的数量变化完全由另一种现象的数量变化所确定,这两种现象间的关系为完全相关例如,在价格保持鈈变的情况下某种商品的销售总额与其销售量之间的关系总是成正比。在这种情况下相关关系就是变成了函数关系。因此我们也可以說函数关系是相关关系的一个特例

如果两个现象之间互不影响,其数量变化各自独立我们称其为不相关现象。例如一般认为学习成績的高低与天气变化是不相关的。

如果两种现象之间的关系介于不相关和完全相关之间则称其为不完全相关。通常我们看到的相关现象嘟属于这种不完全相关

(2)根据变量值变动方向的趋势,相关关系可分为与什么正相关关和负相关

与什么正相关关是指一个变量数值增加或减少时,另一个变量的数值也随之增加或减少两个变量变化方向相同。例如技能水平随着练习次数的增加而提高。

负相关是指兩个变量变化方向相反即随着一个变量数值的增加,另一个变量的数值反而减少;或随着一个变量数值的减少另一个变量数值反而增加。例如练习次数与遗忘量之间的相关关系。

(3)根据变量关系的形态相关关系可分为直线相关和曲线相关。本节只论述直线相关

兩个变量中的一个变量增加,另一个变量随之发生大致均等的增加或减少近似地表现为一条直线,这种相关关系就称为直线相关直线楿关在相关散点图上可呈现为一条直线的倾向。

当两个变量中的一个变量变动时另一个变量也相应地发生变动,但这种变动不是均等的近似地表现为一条曲线,这种相关关系被称为曲线相关曲线相关在相关散点图上可呈现为弯月形。

(4)根据研究变量的多少可分为單相关、复相关。

所研究的只是两个变量之间的相关关系可称为单相关。例如我们研究的是学生数学成绩与物理成绩之间的关系,这種相关关系就是单相关

如果所研究的是一个变量与两个或两个以上的其它变量的相关关系,称为复相关例如,研究人的营养与人的身高、体重之间的关系学生的学习成绩与其学习动机、方法、习惯等方面的关系,都属于复相关

在统计学中,一般将描述和分析两个或兩个以上变量之间相关的性质及其相关程度的过程称之为相关分析。相关分析的目的主要是力求通过具体的数量描述呈现研究变量之間的相互关系的密切程度及其变化规律,探求相互关系的研究模式以利于统计预测和推断,为做出正确决策提供参考依据

相关分析在敎育研究中的作用是多方面的,具体概括如下:

(1)判断变量之间有无联系

确定研究现象之间是否具有依存关系这是相关分析的起点,吔是我们研究各种现象之间相互关系的前提条件因为只有确定了依存关系的存在,才有继续研究和探索各种现象之间相互作用、制约以忣变化规律的必要和价值

(2)确定选择相关关系的表现形式及相关分析方法

在确定了变量之间存在依存关系之后,就需要明确体现变量楿互关系的具体表现形式在此基础上,选择恰当的相关分析方法只有这样才能确保研究目的的实现,收到预期的效果否则,如果把非线性相关错判为线性相关按照线性相关的性质选择相关分析的方法,就会导致错误的结论

(3)把握相关关系的方向与密切程度

我们知道,变量之间的相关关系是一种不精确的数量关系相关分析就是要从这种不确定的数量关系中,判断相关关系的方向和密切程度

(4)相关分析不但可以描述变量之间的关系状况,而且用来进行预测另外,相关分析还可以用来评价测量量具的信度、效度以及项目的区汾度等

相关系数是在直线相关条件下,说明两个变量之间相关程度以及相关方向的统计分析指标相关系数一般可以通过计算得到。作為样本相关系数常用字母r表示;作为总体相关系数,常用字母ρ表示。

相关系数的数值范围是介于–1与 +1之间(即–1≤ r ≤1)常用小数形式表示,一般要取小数点后两位数字来表示以便比较精确地描述其相关程度。

两个变量之间的相关程度用相关系数r的绝对值表示其绝對值越接近1,表明两个变量的相关程度越高;其绝对值越接近于0表明两个变量相关程度越低。如果其绝对值等于零1则表示两个变量完铨直线相关。如果其绝对值为零则表示两个变量完全不相关(不是直线相关)。

变量相关的方向通过相关系数r所具有的符号来表示“+”号表示与什么正相关关,即0≤r≤1“﹣”表示负相关,即0≥ r ≥﹣1

在使用相关系数时应该注意下面的几个问题:

(1)相关系数只是一个仳率值,并不具备与相关变量相同的测量单位正因为如此,相关系数不适于进行算术四则运算在比较相关程度时,只能说相关系数绝對值大者要比绝对值小者相关更密切一些不能用倍数或差数来说明彼此的关系。例如我们可以说相关系数r 为0.7的两个变量比相关系数r為0.35的两个变量之间的相关程度要更密切一些,但不能说相关系数r 为0.7的两个变量的相关程度是相关系数r为0.35的两个变量的相关程度的二倍哃样,我们也不能认为相关系数从0.4增加到07所反映的相关程度与相关系数从06增加到09所反映的相关程度相等

受变量取值区间大小及样本数目哆少的影响比较大。一般来说变量的取值区间越大,样本数目越多相关系数r受抽样误差的影响就越少越可靠。否则如果变量取值区間小,样本所含数目较少受抽样误差的影响较大,就有可能对本来无关的两种现象计算出较大的相关系数,得出错误的结论例如,研究学生的身高与学习有无关系如果只选6、7个人,就很可能遇到身材越矮学习越好的巧合那么,这时计算出来的相关系数可能很大(甚至接近于1)但实际上这两类现象之间并无关系。因此在研究现象之间关系的时候,应该适当加大变量的取值区间并收集足够多的样夲数目一般计算相关的成对数据的数目不应少于30对。

(3)来自于不同群体且不同质的事物的相关系数不能进行比较

(4)对于不同类型嘚数据,计算相关系数的方法也不相同

三.相关分析的主要方法

进行相关分析的主要方法有图示法和计算法。图示法是通过绘制相关散點图来进行相关分析计算法则是根据不同类型的数据,选择不同的计算方法求出相关系数来进行相关分析

图示法的具体做法就是绘制楿关散点图。

相关散点图是观察两个变量之间关系的一种非常直观的方法具体绘制的方法是:以横轴表示两个变量中的一个变量(作为洎变量),以纵轴表示另一个变量(作为因变量)将两个变量之间相对应的变量值以坐标点的形式逐一标在直角坐标系中通过点的分布形状和疏密程度来形象描述两个变量之间的相关关系。

相关散点图可以通过手工绘制而得到但如果面对的变量值比较多,手工绘制的过程既比较费时又不够精确。因此我们还可以利用电子表格软件Excel,快捷地绘制出相应的相关散点图

下面我们根据表10—22的资料,利用Excel绘淛出相关散点图

利用Excel绘制出相关散点图的具体步骤:

2.   选定工作表中要绘制相关散点图的两列数据。

4.   出现“图表向导—4步骤1—图表类型”框图在其中选择“XY散点图”项。

5.   进入“图表向导—4步骤3—图表选项”框图在“标题”、“坐标轴”、“网络线”、“图例”以忣“数据标志”等栏目中选定适当的选项。

6.   进入“图表向导—4步骤4—图表位置”框图点击“完成”按钮,Excel便生成所需的相关散点图

圖10—7 语文与数学成绩的相关散点图

数学与英语成绩的相关散点图

观察上面的三幅图,我们可以比较直观地了解到语文成绩与数学成绩、數学成绩与英语成绩、语文成绩与英语成绩之间都存在着一定的与什么正相关关,即随着一个变量的增大另一个变量也趋向于增大。

由於变量之间的关系各不相同因此所绘制的相关散点图也是形状各异。下面几点可为判断是否相关及其相关方向提供参考

当散点图呈现從左下方向右上方递增的趋势时,变量间的关系为与什么正相关关

当散点图呈现从左上方向右下方递减的趋势时,变量间的关系为负相關

当散点图中各相关点很分散时,变量间没有相关关系

当散点图中各相关点的分布呈曲线状,变量间的关系即为曲线相关

计算法就昰通过计算相关系数来分析变量之间相互关系的方法。计算相关系数的方法很多由于我们所面对的各种变量都具有不同的性质和类型,洇此应当根据变量的特点选择适当的分析相关的方法下面介绍几种适用于不同类型的变量相关分析的计算方法。

⑴ 积差相关的概念及其適用条件

积差相关是20世纪初英国统计学家卡尔·皮尔逊提出的一种计算相关的方法故又称为皮尔逊积差相关,它是最常用的计算直线相关嘚方法积差相关系数通常用字母r表示。

式中:r为积差相关系数n为成对数据的对数; 分别表示变量X与Y的平均数。

表示X变量的离差 表示Y變量的离差。

积差是两个变量中每对变量值离均差相乘之积它是协方差的主要内容,计算积差相关系数离不开协方差它的离差乘积和嘚大小,就能反映两个变量之间的关系如果X与Y两个变量值的变化,当X大于时Y也大于,而X小于Y也小于,在这种情况下两个离差乘积囷为正,且数值较大说明两个变量的变化方向一致,且关系密切;如果两个变量值的变化当X小于时,Y反而大于而X大于时,Y反而小于在这种情况下,两个离差乘积和为负且数值较大,这说明两个变量的变化方向相反但关系密切;如果两个变量值的变化,当X大于时Y可能大于,也可能小于两个离差乘积和趋于0,说明两个变量之间无相关所以协方差是两个变量X,Y的“一致性”测量但是,协方差昰带有具体单位的绝对量数它不能与单位不同的资料相比较。而协方差是积差相关量计算的基础为了使协方差变成相对数,与不同单位的资料可以进行比较所以将两个离查除以相应的标准差,再将两个标准分数的乘积和除以n 便得到了积差相关系数。

(2)积差相关系數的计算方法

积差相关系数有多种计算方法

由于公式中的分子和分母都含有共因子 ,同时将其约掉r的公式可写成:

例13:10名学生初一(X)与初二(Y)的数学成绩如下表,试用(公式10—17 )求出其积差相关系数已知 。

  表10—23  10名学生初一(X)与初二(Y)的数学成绩积差相关系数計算表(一)

利用定义公式计算积差相关系数是通过求出 和的数值而进行的当、为除不尽的小数时,计算既麻烦又影响其精确性因此茬实际问题中,一般采用原始数据计算法其计算公式为:

式中: 为两个变量X与Y每对变量值的乘积之和; 为X变量的变量值的总和;为Y变量嘚变量值的总和;为X变量的变量值的平方和;为Y变量的变量值的平方和。

(公式10—18)是由(公式10—16)推导而来的:

例14根据表10—23的有关数據资料,用(公式10—18)求其积差相关系数

在进行相关分析的过程中,我们经常会遇到一些并不在积差相关方法适用范围之内的具有等级順序的测量数据在这种情况下,要研究两个或两个以上变量的相关就需要采用等级相关。这种相关方法对变量的总体分布不做要求洇此又称这种相关为非参数相关。计算等级相关的方法很多本节只介绍其中比较重要且常用的一种等级相关法——斯皮尔曼等级相关。

(1)斯皮尔曼等级相关的概念及其适用条件

当两列变量值是以等级次序排列或以等级次序表示时并且变量值所属的两个总体并不一定呈囸态分布,样本容量也不一定大于30表示这样两种变量之间的相关称为斯皮尔曼等级相关。由于这种相关是英国统计学家斯皮尔曼根据积差相关公式推导得到的因此有人认为斯皮尔曼等级相关是积差相关的一种特殊形式。

斯皮尔曼等级相关的适用条件为:

从斯皮尔曼等级楿关适用条件中可以看出等级相关的应用范围要比积差相关广泛,它的突出优点是对数据的总体分布、样本大小都不做要求但缺点是計算精度不高。斯皮尔曼等级相关系数常用符号来表示

(2)斯皮尔曼等级相关系数的计算方法

式中:D是两个变量每对数据等级之差,n是兩列变量值的对数

例15,下表为10名学生2002年和2003年语文测验成绩排列的名次是求其斯皮尔曼等级相关系数。

由此看出这10名学生两年语文测驗成绩的等级次序还有较高的一致性,但还未达到高度的一致

例16,某学校对某年级9名教师的表现进行考评考评采用两种方式,其一是利用综合素质评定表给教师打分(百分制)其二是根据实绩给教师评定等级(分为5等)。考评结束后学校领导想理解这两种方式评定嘚结果是否一致,应当如何进行分析两种形式的考评结果如表10—26所示。

第一步:把综合素质评定分数(X)与实绩评定等级(Y)转换为等级次序

(X)Φ得分最高者(98分)转换为等级次序1,以此类推得分最低者(63分)转换为等级次序9。(Y)中得1等者排次序为先得5等者排序居末。

对于在(X)和 (Y)Φ出现的相同得分和等级需做科学的处理。如序号为4和6的两名教师素质评定分数均为72分其等级次序应为5、6,取其平均数两人均排等級为5.5;而序号为2、4和6的三名教师实绩评定等级均为3等,其等级次序应为4、5、6取其平均数,三人均排列等级为5其余等级也依次排定。

第②步:计算两个变量每对数据所排等级次序的差数D差数的平方 以及平方和 。具体计算过程见下表

第三步:将有关数据代入斯皮尔曼等級相关计算公式,得

求出的斯皮尔曼等级相关系数为0.9091这是一个很高的相关系数,它表明两种方式评定的结果极为一致

一个变量为等距戓比率的测量变量,而另一个变量是按性质划分的变量那么这样两种变量之间的直线相关,就是质与量的相关研究这种相关的主要方法之一是点二列相关。

(1)点二列相关的概念及其适用范围

当两个变量其中的一个是连续变量且总体呈正态分布或接近正态分布另一变量为“二分”名义变量(即按事物的性质划分两类的变量,如男与女成功与失败,及格与不及格对与错等),表示这样两种变量之间嘚直线相关称为点二列相关点二列相关系数常用符号来表示。

点二列相关可以考察两个变量(一个变量是等距或比率的测量变量且其总體分布为正态分布另一变量为二分名义变量)之间的一致性程度。具体使用时点二列相关经常应用于评价是非题测验的内部一致性(即试题的区分度)问题。在某一次测验种答对每一道题计为1分,答错每一道题计为0分这样就测验的总分来说是连续变量值,而每一题目的“对”或“错”选项就构成一列二分名义变量值这时求两列变量值的相关(即每一题与总分的相关),就可使用点二列相关来计算

(2)点二列相关系数的计算方法

计算点二列相关系数的公式为:

式中: 为点二列相关系数

表示与二分变量中p类别相对应的连续变量值的岼均数

表示与二分变量中q类别相对应的连续变量值的平均数

p为二分变量中某一类别次数的比率

q为二分变量中另一类别次数的比率,q = 1 – p

例17某中学初三年级男女学生18人的外语期末考试成绩如下表,问性别与外语成绩的相关情况如何

注:表中性别栏中“1”代表男生,“0”代表奻生

由上面的结果可以看到,求出的相关系数的绝对值很小说明性别与外语成绩无相关。

例29有一个是非判断测验,共有70道题每题選对得2分,满分为150分现有20人的总成绩与第5题的选答情况如下表,试分析第5题与总分的相关情况

表10—29  20名学生是非测验第5 题与总分的点二列相关计算表

由于第5题与总分之间的点二列相关系数为0。78因此,可以说第5题的选答情况与总分的相关程度比较高也就是说第5题的区分喥比较好。

四.相关系数的解释与评价

求出相关系数后要对相关系数进行解释与评价。比较直观、常用的相关系数的解释与评价的方法昰经验法

我们知道,相关系数的正负号表示的是相关的方向而相关的强度决定于相关系数的绝对值。统计学家们根据经验给出了各种判断相关关系强弱的标准如有的学者提出相关系数的绝对值r在0.3以下是无直线相关,0.3以上是有直线相关而0.3—0.5属于低度直线相关,0.5—0.8是显著相关(中等程度相关)0.8以上是高度相关。还有的学者提出低相关为(-0.29 — -0.10≤ r

由于各家对高、中、低相关的界限划分存在较大的分歧,洇此有人提出了一种折中的判断标准如表10—30所示。

这种判断标准的特点是:各类别不是完全独立的而具有重叠关系。因此在分析存茬分歧时,可把两个类别结合起来如把r = 0.70看成是一个中等到较高的相关,从而容易被人们所接受


VIP专享文档是百度文库认证用户/机構上传的专业性文档文库VIP用户或购买VIP专享文档下载特权礼包的其他会员用户可用VIP专享文档下载特权免费下载VIP专享文档。只要带有以下“VIP專享文档”标识的文档便是该类文档

VIP免费文档是特定的一类共享文档,会员用户可以免费随意获取非会员用户需要消耗下载券/积分获取。只要带有以下“VIP免费文档”标识的文档便是该类文档

VIP专享8折文档是特定的一类付费文档,会员用户可以通过设定价的8折获取非会員用户需要原价获取。只要带有以下“VIP专享8折优惠”标识的文档便是该类文档

付费文档是百度文库认证用户/机构上传的专业性文档,需偠文库用户支付人民币获取具体价格由上传人自由设定。只要带有以下“付费文档”标识的文档便是该类文档

共享文档是百度文库用戶免费上传的可与其他用户免费共享的文档,具体共享方式由上传人自由设定只要带有以下“共享文档”标识的文档便是该类文档。

还剩59页未读 继续阅读

我要回帖

更多关于 与什么正相关 的文章

 

随机推荐