你好,如果我要探讨spss性别差异与成绩的关系,可以用SPSS统计方法分析里的哪几种来分析,最好两种以上,谢谢~~~

spss实验报告心得,spss实验报告,spss统计分析实验报告,spss实验心得_教师联盟网
您现在的位置: >> spss实验报告心得体会 >> spss实验报告心得,spss实验报告,spss统计分析实验报告,spss实验心得
spss实验报告心得,spss实验报告,spss统计分析实验报告,spss实验心得
第一篇:spss实验报告心得Spss16.0 与统计数据分析
实 验 报 告
实验主题 实验题目 实训时间 学生姓名 实训地点 SPSS 统计分析 均值比较与 T 检验、方差分析、相关分析、回归分析
学年 第二学期 15 周 (2011 年 5 月 30 日―6 月 3 日)
均值比较与 T 检验 ..................................................................................... 2 一 、实验目的....................................................................................... 2 二、 实验内容....................................................................................... 2 三、心得与体会..................................................................................... 4 方差分析 ...................................................................................................... 4 一 实验目的 ........................................................................................... 4 二 实验内容 ........................................................................................... 4 三、心得与体会................................................................................... 14 相关分析 .................................................................................................... 14 一 实验目的 ......................................................................................... 14 二 实验内容 ......................................................................................... 14 三、心得与体会................................................................................... 18 回归分析 .................................................................................................... 18 一 实验目的 ......................................................................................... 18 二 实验内容 ......................................................................................... 18 三、心得与体会................................................................................... 25
均值比较与 T 检验
一 、实验目的
为掌握 SPSS 统计分析中的均值比较与 T 检验方法
(1)均值比较 (2)单样本 T 检验(One-Sample T Test) (3)独立样本 T 检验(Independent Sample T Test) (4)配对样本 T 检验(Paired-Sample T Test)
二、 实验内容
题目一:表 5.14 是某班级学生的高考数学成绩,试分析该班的数学成绩与全国的平均成绩 70 分之间是否 有显著性差异。
序号 1 2 3 4 5 6 7 8 9 成绩 63 99 81 77 68 79 80 63 87 序号 10 11 12 13 14 15 16 17 18 成绩 94 98 73 89 98 77 67 69 81 序号 19 20 21 22 23 24 25 26 27 成绩 70 65 84 84 95 61 69 73 60
实验结果截图:
One-Sample Statistics N 成绩 27 Mean 77.93 Std. Deviation 12.111 Std. Error Mean 2.331
One-Sample Test Test Value = 70 95% Confidence Interval of the Difference t 成绩 3.400 df 26 Sig. (2-tailed) .002 Mean Difference 7.926 Lower 3.13 Upper 12.72
实验结果分析:
由上表可看出,双尾检测概率 P 值为 0.002,小于 0.05,故拒绝零假设,也就是说在显著性水平 0.05 下,该班的数学成绩与全国的平均成绩 70 分之间有显著性差异。
题目二:在某次测试中,随机抽取男女同学的成绩各10名,数据如下:
男:99 79 59 89 79 89 99 82 80 85 女:88 54 56 23 75 65 73 50 80 65
假设样本总体服从正态分布,比较在致信度为 95%的情况下男女得分是否有显著性差异。
实验结果截图:
Group Statistics 性别 成绩 男 女 N 10 10 Mean 84.00 62.90 Std. Deviation 11.528 18.454 Std. Error Mean 3.645 5.836
实验结果分析:
对于齐次性,这里采用的是 F 检验,表中第一列是 F 统计量的值,为 1.607,第二列是对应的概率 P 值,为 0.221&0.05,可以认为两个总体的方差无显著性差异,即方差具备齐性。在方差相等的情况下,相 应的双尾检测概率为 0.007&0.05, 故拒绝零假设, 即认为在致信度为 95%的情况下男女得分有显著性差异。
题目三:某医疗机构为研究某种减肥药的疗效,对 16 位肥胖者进行为期半年的观察测试,测试指标为使
用该药之前和之后的体重,数据如表 5.15 所示。假设体重近似服从正态分布,试分析服药前后, 体重是否有显著变化。
表 5.15 服药前后的体重变化
服药前后的体重数据 服药前 体重 服药后 体重 198 237 233 179 219 169 222 167 199 233 179 158 157 216 257 151 192 225 226 172 214 161 210 161 193 226 173 154 143 206 249 140
实验结果截图:
Paired Samples Statistics Mean Pair 1 服药前体重 服药后体重 198.38 190.31 N 16 16 Std. Deviation 33.472 33.508 Std. Error Mean 8.368 8.377
Paired Samples Correlations N Pair 1 服药前体重 & 服药后体重 16 Correlation .996 Sig. .000
实验结果分析:
由上表可知,在显著性水平为 0.05 时,服药前后的概率 p 值为 0.000,小于 0.05,拒绝零假设,说明 服药前后的体重有显著性变化。
三、心得与体会
通过本次实验我掌握了: (1)均值比较,用于计算指定变量的综合描述统计量; (2)单样本 T 检验(One-Sample T Test) ,检验单个变量的均值与假设检验之间是否存在差异; (3)独立样本 T 检验(Independent Sample T Test),用于检验两组来自独立总体的样本,其独立总 体的均值或中心位置是否一样; (4)配对样本 T 检验(Paired-Sample T Test),用于检验两个相关的样本是否来自具有相同均值的 总体。但在实验中仍遇到了一些问题, 在实验的一开始对齐性分析不是很清楚, 变量的设置有时候会倒置等, 后来查了一些资料,再看书上的一些例题才弄明白。
一 实验目的
掌握单因素方差分析的原理与步骤、多因素方差分析的原理与步骤、协方差分析的原理与步骤。
二 实验内容
题目一: 某农场为了比较 4 种不同品种的小麦产量的差异, 选择土壤条件基本相同的土地, 分成 16 块, 将每一个品种在 4 块试验田上试种,测得小表亩产量(kg)的数据如表 6.17 所示(数据文件 为 data6-4.sav) , 试问不同品种的小麦的平均产量在显著性水平 0.05 和 0.01 下有无显著性 差异。(数据来源: 《SPSS 实用统计分析》 郝黎仁,中国水利水电出版社)
表 6.17 小麦产量的实测数据 品种 A1 277.5 产量 276.4 271 272.4 A2 244.2 249.5 236.8 239 A3 249.2 244.2 252.8 251.4 A4 273 240.9 257.4 266.5
实验结果截图:
Multiple Comparisons 产量 LSD Mean Difference (I) 品种 A1 (J) 品种 A2 A3 A4 A2 A1 A3 A4 A3 A1 A2 A4 A4 A1 A2 A3 (I-J) 31.00 14.87500
95% Confidence Interval Std. Error 5.44 5.44 5.44 5.44 5.44 5.44 Sig. .000 .001 .020 .000 .231 .011 .001 .231 .104 .020 .011 .104 Lower Bound 19.1 2.9 -19.9 -36.9 -21.9 4.9 Upper Bound 43.9 27.1 5.1 -12.9 2.1 28.9
-7.000 -24.67500
7.000 -14.00
*. The mean difference is significant at the 0.05 level.
实验结果分析:
根据不同小麦的平均产量在显著性水平0.05和0.01下的奇性检验结果、方差检验结果、多 重比较结果、均值折线图可以看出,不管是方差还是均值,差异较大,而它的均值折线图分 布比较陡峭。所以,不同小麦的平均产量有显著差异。
题目二:2. 某公司希望检测四种类型的轮胎 A,B,C,D 的寿命(由行驶的里程数决定) ,见表 6.18(单
位:千英里) (数据文件为 data6-5.sav) ,其中每种轮胎应用在随机选择的 6 辆汽车上。在显著性 水平 0.05 下判断不同类型轮胎的寿命间是否存在显著性差异?(数据来源: 《统计学(第三版),M.R. 》
斯皮格尔,科学出版社) 表 6.18 四种轮胎的寿命数据 A B C D 33 32 31 29 38 40 37 34 36 42 35 32 40 38 33 30 31 30 34 33 35 34 30 31
实验结果截图:
ANOVA 里程 Sum of Squares Between Groups Within Groups Total 77.500 216.333 293.833 df 3 20 23 Mean Square 25.833 10.817 F 2.388 Sig. .099
Multiple Comparisons Dependent Variable:里程 Mean Difference (I) 轮胎 LSD A (J) 轮胎 B C D B A C D C A B D D A B C (I-J) -.500 2.167 4.000
95% Confidence Interval Std. Error 1.899 1.899 1.899 1.899 1.899 1.899 1.899 1.899 1.899 1.899 1.899 1.899 6 Sig. .795 .267 .048 .795 .176 .028 .267 .176 .346 .048 .028 .346 Lower Bound -4.46 -1.79 .04 -3.46 -1.29 .54 -6.13 -6.63 -2.13 -7.96 -8.46 -5.79 Upper Bound 3.46 6.13 7.96 4.46 6.63 8.46 1.79 1.29 5.79 -.04 -.54 2.13
.500 2.667 4.500
-2.167 -2.667 1.833 -4.000 -4.500
-.500 2.167 4.000 .500 2.667 4.500 -2.167 -2.667 1.833 -4.000 -4.500 -1.833
2.349 1.701 1.538 2.349 2.201 2.078 1.701 2.201 1.302 1.538 2.078 1.302
1.000 .797 .176 1.000 .838 .352 .797 .838 .722 .176 .352 .722
-8.40 -3.46 -1.34 -7.40 -5.04 -3.22 -7.79 -10.37 -2.51 -9.34 -12.22 -6.18
7.40 7.79 9.34 8.40 10.37 12.22 3.46 5.04 6.18 1.34 3.22 2.51
*. The mean difference is significant at the 0.05 level.
实验结果分析:
在多重比较结果图里,有 4 个组之间的相伴概率都小于显著性水平,而且,在各组均值 的折线图里,我们也可以看出四组存在了显著性差异。所以四种不同类型轮胎的寿命间存在 显著性差异。题目三:将 4 种不同的水稻品种 A1,A2,A3,A4 安排在面积相同的 4 种不同土质的地块 B1,B2,B3,B4
中试种,测得各地块的产量(kg)如表 6.19(数据文件为 data6-6.sav) ,试分别在显著性水平 为 0.05 和 0.01 下检验不同水稻品种、不同土质及二者交互作用对水稻产量的影响。(数据来源: 《SPSS 实用统计分析》郝黎仁,中国水利水电出版社)
表 6.19 四种水稻的产量数据 B1 A1 A2 A3 A4 135 154 125 115 B2 120 129 129 124 B3 147 125 120 119 B4 132 125 133 123
实验结果截图:
Warnings Post hoc tests are not performed for 水稻 because error term has zero degrees of freedom. Post hoc tests are not performed for 土地 because error term has zero degrees of freedom.
Between-Subjects Factors Value Label 水稻 1 2 3 4 土地 1 A1 A2 A3 A4 B1 N 4 4 4 4 4 7
Tests of Between-Subjects Effects Dependent Variable:产量 Type III Sum of Source Corrected Model Intercept rice soil rice * soil Error Total Corrected Total Squares
df 15 1 3 3 9 0 16 15
Mean Square 104.796
158.229 31.563 111.396 .
F . . . . .
Sig. . . . . .
474.687 94.688 0
a. R Squared = 1.000 (Adjusted R Squared = .)
1. 水稻 Dependent Variable:产量 99% Confidence Interval 水稻 A1 A2 A3 A4 Mean 133.500 133.250 126.750 120.250 Std. Error . . . . Lower Bound . . . . Upper Bound . . . .
2. 土地 Dependent Variable:产量 99% Confidence Interval 土地 B1 B2 B3 B4 Mean 132.250 125.500 127.750 128.250 Std. Error . . . . Lower Bound . . . . Upper Bound . . . .
3. 水稻 * 土地 Dependent Variable:产量 99% Confidence Interval 水稻 A1 土地 B1 B2 Mean 135.000 120.000 Std. Error . . 8 Lower Bound . . Upper Bound . .
B3 B4 A2 B1 B2 B3 B4 A3 B1 B2 B3 B4 A4 B1 B2 B3 B4
147.000 132.000 154.000 129.000 125.000 125.000 125.000 129.000 120.000 133.000 115.000 124.000 119.000 123.000
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
实验结果分析:
由上述各种结果图可以看出不同水稻品种、不同土质对水稻产量的影响差异性显著,而 且,两控制变量对观测变量的交互作用图中,两因素相交,说明了有交互作用的影响。同理 可得在显著性水平为 0.01 下也有上述结论。题目四:某超市将同一种商品做 3 种不同的包装(A)并摆放在 3 个不同的货架区(B)进行销售试验,
随机抽取 3 天的销售量作为样本,具体资料见表 6.20。要求检验:在显著性水平 0.05 下商品包 装、摆放位置及其搭配对销售情况是否有显著性影响。(数据来源: 《应用统计学》 耿修林,科学出版 社;数据文件:data6-7.sav)
表 6.20 销售样本资料 B1 A1 A2 A3 5,6,4 7,8,8 3,2,4 B2 6,8,7 5,5,6 6,6,5 B3 4,3,5 3,6,4 8,9,6
实验结果截图:
Between-Subjects Factors Value Label 包装 1 2 3 摆放位置 1 2 3 A1 A2 A3 B1 B2 B3 N 9 9 9 9 9 9
Tests of Between-Subjects Effects Dependent Variable:销量 Type III Sum of Source Corrected Model Intercept casing place casing * place Error Total Corrected Total Squares 65.407
df 8 1 2 2 4 18 27 26
Mean Square 8.176 822.259 .481 1.593 15.315 1.074
F 7.612 765.552 .448 1.483 14.259
Sig. .000 .000 .646 .253 .000
822.259 .963 3.185 61.259 19.333 907.000 84.741
a. R Squared = .772 (Adjusted R Squared = .670)
Multiple Comparisons Dependent Variable:销量 Mean Difference (I) 包装 LSD A1 (J) 包装 A2 A3 A2 A1 A3 A3 A1 A2 Tamhane A1 A2 A3 A2 A1 A3 A3 A1 A2 (I-J) -.44 -.11 .44 .33 .11 -.33 -.44 -.11 .44 .33 .11 -.33 Std. Error .489 .489 .489 .489 .489 .489 .778 .915 .778 .941 .915 .941 Sig. .375 .823 .375 .504 .823 .504 .924 .999 .924 .980 .999 .980 95% Confidence Interval Lower Bound -1.47 -1.14 -.58 -.69 -.92 -1.36 -2.52 -2.58 -1.63 -2.19 -2.36 -2.86 Upper Bound .58 .92 1.47 1.36 1.14 .69 1.63 2.36 2.52 2.86 2.58 2.19
Multiple Comparisons Dependent Variable:销量 Mean Difference (I) 包装 LSD A1 (J) 包装 A2 A3 A2 A1 A3 A3 A1 A2 Tamhane A1 A2 A3 A2 A1 A3 A3 A1 A2 Based on observed means. The error term is Mean Square(Error) = 1.074. (I-J) -.44 -.11 .44 .33 .11 -.33 -.44 -.11 .44 .33 .11 -.33 Std. Error .489 .489 .489 .489 .489 .489 .778 .915 .778 .941 .915 .941 Sig. .375 .823 .375 .504 .823 .504 .924 .999 .924 .980 .999 .980 95% Confidence Interval Lower Bound -1.47 -1.14 -.58 -.69 -.92 -1.36 -2.52 -2.58 -1.63 -2.19 -2.36 -2.86 Upper Bound .58 .92 1.47 1.36 1.14 .69 1.63 2.36 2.52 2.86 2.58 2.19
Multiple Comparisons Dependent Variable:销量 Mean (I) 摆放位 置 LSD B1 (J) 摆放位置 B2 B3 B2 B1 B3 B3 B1 B2 Tamhane B1 B2 B3 B2 B1 B3 B3 B1 B2 Based on observed means. The error term is Mean Square(Error) = 1.074. Difference (I-J) -.78 -.11 .78 .67 .11 -.67 -.78 -.11 .78 .67 .11 -.67 Std. Error .489 .489 .489 .489 .489 .489 .795 1.011 .795 .782 1.011 .782 Sig. .129 .823 .129 .189 .823 .189 .724 .999 .724 .796 .999 .796 Lower Bound -1.80 -1.14 -.25 -.36 -.92 -1.69 -3.00 -2.80 -1.45 -1.52 -2.58 -2.85 Upper Bound .25 .92 1.80 1.69 1.14 .36 1.45 2.58 3.00 2.85 2.80 1.52 95% Confidence Interval
实验结果分析:
根据上述的各个结果图里面可以看出,不仅在任何检验中 sig.&0.05,而且它们的交互影 响折线图在相同的情况下,是平行的。所以,在显著性水平 0.05 下,商品包装、摆放位置及 其搭配对销售情况没有显著性影响。题目五:研究杨树一年生长量与施用氮肥和钾肥的关系。为了研究这种关系,一共进行了 18 个样地的栽
培实验,测定杨树苗的一年生长量、初始高度、全部实验条件(包括氮肥量和钾肥量)及实验 结果(杨树苗的生长量)数据如表 6.21,请在显著水平 0.05 下检验氮肥量、钾肥量及树苗初始 高度中哪些对杨树的生长有显著性影响。(数据来源: 《生物数学模型的统计学基础》李勇,科学出版社; 数据文件:data6-8.sav)
表 6.21 杨树栽培试验数据 序号 1 2 3 4 5 6 7 8 9 氮肥量 钾肥量 树苗初高 生长量 序号 氮肥量 钾肥量 少 少 少 少 少 少 少 少 少 0 0 0 12.5 12.5 12.5 25 25 25 4.5 6 4 6.5 7 5 7 5 5 1.85 2 1.6 2 2.04 1.91 2.4 4.25 2.1 10 11 12 13 14 15 16 17 18 多 多 多 多 多 多 多 多 多 0 0 0 12.5 12.5 12.5 25 25 25 树苗初高 6.5 6 6.5 4 6 5.5 5 6 5.5 生长量 2.15 1.99 2.06 1.93 2.1 2.15 4.2 2.3 4.25
实验结果截图:
Warnings Post hoc tests are not performed for 氮肥量 because there are fewer than three groups. Post hoc tests are not performed for 初始高度 because at least one group has fewer than two cases.
Between-Subjects Factors 12
N 氮肥量 多 少 钾肥量 0 12.5 25 初始高度 4 4.5 5 5.5 6 6.5 7 9 9 6 6 6 2 1 4 2 4 3 2
Tests of Between-Subjects Effects Dependent Variable:生长量 Type III Sum of Source Corrected Model Intercept N K height N * height K * height Error Total Corrected Total Squares .574
df 15 1 1 2 6 1 3 2 18 17
Mean Square .038 57.772 6.429E-5 .072 .029 .000 .006 .008
F 5.006 8 9.378 3.748 .046 .790
Sig. .179 .000 .935 .096 .226 .850 .601
57.772 6.429E-5 .143 .172 .000 .018 .015 77.801 .590
a. R Squared = .974 (Adjusted R Squared = .779)
Multiple Comparisons Dependent Variable:生长量 Mean Difference (I) 钾肥量 (J) 钾肥量 LSD 0 12.5 25 12.5 0 25 25 0 12.5 Tamhane 0 12.5 25 (I-J) -.0800 -.3083
95% Confidence Interval Std. Error .0 .0 .0 .0 13 Sig. .254 .026 .254 .046 .026 .046 .776 .028 Lower Bound -.2973 -.5256 -.1373 -. .0111 -.3518 -.5808 Upper Bound .1373 -. -. . -.0358
.0800 -.2283
-.0800 -.3083
.0800 -.2283
.776 .007 .028 .007
-.1918 -. .0679
.3518 -. .3888
Based on observed means. The error term is Mean Square(Error) = .008. *. The mean difference is significant at the 0.05 level.
实验结果分析:
在方差齐性检验结果中,其相伴概率值 sig.=0.085&0.05,所以此分组的方差具有奇性。但是 在检验控制变量与协变量的交互作用中,可以看出,N 和 K,N 和 height,K 和 height 的交互 作用项 sig.均大于 0.05,所以它们之间都没有交互作用。而在协方差分析图中,我们又可以 看出 N,K,height 所对应的组的 sig.都小于 0.05.。所以,在显著水平 0.05 下,氮肥量、钾肥 量及树苗初始高度中分别对杨树的生长都有显著性影响。
三、心得与体会 通过这次的关于方差分析的上机操作实验,我学会了单因素方差分析的原理与步骤、多 因素方差分析的原理与步骤、协方差分析的原理与步骤,还有怎么去对观测变量的总体分布 下的基本假设来实践操作分析对各总体分布是否有显著差异分析以及推断。在进一步的学习 上与操作上,也加深了我对 Spss 这个软件的了解以及应用。并且,也会帮助自己在今后的学 习上取得一定的进步。
一 实验目的
1、掌握 SPSS 软件进行简单统计分析的一般操作,并对处理结果做出解释; 2、理解相关系数、秩相关系数与偏相关系数的差异,并结合描述性统计分析,综合分析得到的结果; 掌握二元变量相关分析;掌握偏相关分析;掌握距离分析;
二 实验内容
题目三:K.K.Smith在烟草杂交繁殖的花上收集到如表8.16所示的数据,要求对以上3组数据两两之 间进行相关分析,以0.05的显著性水平检验相关系数的显著性。(数据来源: 《统计软件SPSS 系列应用实践篇》 苏金明 ,电子工业出版社;数据文件:data8-5.sav)
表8.16 K.K.Smith所调查的长度资料 花瓣长 49 44 32 42 32 53 36 39 37 45 41 48 45 39 40 34 37 35 花枝长 27 24 12 22 13 29 14 20 16 21 22 25 23 18 20 15 20 13 花萼长 19 16 12 17 10 19 15 14 15 21 14 22 22 15 14 15 15 16
实验结果截图:
Correlations 花瓣长 花瓣长 Pearson Correlation Sig. (2-tailed) 14 1.000 花枝长 .955
花萼长 .797
N 花枝长 Pearson Correlation Sig. (2-tailed) N 花萼长 Pearson Correlation Sig. (2-tailed) N
18.000 .955
.000 18 .797
.002 18.000 .678
.002 18 18.000
**. Correlation is significant at the 0.01 level (2-tailed).
实验结果分析:
由上表可知:在0.05的显著性水平下,花枝长与花瓣长的相关系数为0.995&0,说明呈正相关,而相 伴概率值sig.=0.000&0.05,因此应拒绝零假设(H0:两变量之间不具相关性),即说明花枝长是受花瓣长 显著性正影响的;同理可得,花萼长也是受花瓣长显著性正影响的。花瓣长与花萼长也是受花枝长显著性 正影响的,花瓣长与花枝长也受花萼长显著性正影响的。题目四:试确定年安徽省国民收入与城乡居民储蓄存款余额两个变量间的线性相关性,数据如 表8.17所示。(数据来源: 《数据统计与管理》 1990年第5期, 中国商场统计研究会主办; 数据文件: data8-6.sav)
年份 国民收入(亿元) 存款余额(亿元) 年份 国民收入(亿元) 存款余额(亿元)
年安徽省国民收入数据表
68 71 74 82 2.55 .44 2.61
34.61 35.67 39.52 47.32 54.14 50.86 49.69 51.61 65.06 72.57 77.72 83.57 0.59
95.63 97.23 103.81 116.29 127.87 150.29 161.47 180.2 221.17 271.81 310.53 357.86 444.78 2.74 3.13 3.91 5.75 8.76 12.19 16.36 20.95 28.32 38.43 55.43 74.2 89.83
实验结果截图:
Correlations 国民收入 国民收入 Pearson Correlation Sig. (2-tailed) N 存款余额 Pearson Correlation Sig. (2-tailed) N 27.000 .976
存款余额 .976
.000 27 1.000
.000 27 27.000
**. Correlation is significant at the 0.01 level (2-tailed).
实验结果分析:
由上表看出,相关系数为0.976&0,说明呈正相关,而相伴概率值sig.=0.000&0.01,因此应拒绝零假 设(H0:两变量之间不具相关性),即说明国民收入与城乡居民储蓄存款余额两变量在0.01水平下是显著 相关的。题目五:某高校抽样得到10名短跑运动员,测出100米的名次和跳高的名次如表8.18,问这两个名次是否在
0.05的显著性水平下具有相关性。(数据来源: 《应用统计学:数据统计方法、数据获取与SPSS应用》 马庆
国,科学出版社;数据文件:data8-7.sav) 表8.18 10名运动员的100米及跳高名次 百米名次 跳高名次 1 4 2 3 3 1 4 5 5 2 6 7 7 10 8 8 9 9 10 6
实验结果截图:
Descriptive Statistics Mean 百米名次 跳高名次 5.50 5.50 Std. Deviation 3.028 3.028 N 10 10
Correlations 百米名次 百米名次 Pearson Correlation Sig. (2-tailed) Sum of Squares and Cross-products Covariance N 跳高名次 Pearson Correlation Sig. (2-tailed) Sum of Squares and Cross-products Covariance N 82.500 9.167 10 .697
跳高名次 1 .697
.025 57.500 6.389 10 1
.025 57.500 6.389 10 82.500 9.167 10
*. Correlation is significant at the 0.05 level (2-tailed).
实验结果分析:
相关系数为0.697&0,说明呈正相关,而相伴概率值sig=0.025&0.05,说明百米名次和跳 高名次在0.05水平下是显著相关的。
题目六:某公司太阳镜销售情况如表8.19所示,请分析销售量与平均价格、广告费用和日照时间之间的关 系,并说明此题用偏相关分析是否有实际意义(显著性水平为0.05)(数据来源: 。《SPSS for Windows
统计分析(第3版) 卢纹岱,电子工业出版社;数据文件:data8-8.sav) 》 表8.19 某公司销售太阳镜的数据
月份 销量 价格 广告费用 日照时间
75 90 148 183 242 263 278 318 256 200 140 80 6.8 6.5 2 5 2.4 4 2.9 2.6 25 28 2.1 3.1 3.6 4.2 4.2 30 22 18 10 2 2
8.4 10.4 11.5 9.6 6.1 3.4
实验结果截图:
Correlations 16
Control Variables 销量 价格 Correlation Significance (2-tailed) df 广告费用 Correlation Significance (2-tailed) df 日照时间 Correlation Significance (2-tailed) df
价格 1.000 . 0 .040 .906 9 .509 .110 9
广告费用 .040 .906 9 1.000 . 0 -.253 .454 9
日照时间 .509 .110 9 -.253 .454 9 1.000 . 0
实验结果分析:
由上表可看出,销量与价格呈负相关,广告费用与日照时间也呈负相关。
题目七:某动物产下3个幼仔,现分别对3个幼仔的长、体重、四肢总长、头重进行测量,试就这几个测
量数据而言,用距离分析法分析3个幼仔的相似性,数据如表8.20所示。(数据文件为:data8-9.sav)
表8.20 三个幼仔的数据指标 序号 长 1 2 3 50 51 52 体重 215 220 220 四肢总长 100 110 112 头重 11 12 12
实验结果截图:
Case Processing Summary Cases Valid N 3 Percent 100.0% N 0 Missing Percent .0% N 3 Total Percent 100.0%
Proximity Matrix Euclidean Distance 1 1 2 3 .000 11.269 13.191 2 11.269 .000 2.236 3 13.191 2.236 .000
This is a dissimilarity matrix
实验结果分析:
由上表可知:幼仔 1 和幼仔 2 比较相似,和幼仔三相差最大。幼仔 2 和幼仔 3 最相似。
三、心得与体会
通过这次的试验操作,我学会了使用SPSS 软件进行简单统计分析的一般操作,并对处理结果做出解 释,理解相关系数、秩相关系数与偏相关系数的差异,并结合描述性统计分析,综合分析得到的结果; 掌握二元变量相关分析;掌握偏相关分析;掌握距离分析。而且,在试验中,我不仅学会了对随机变量 之间进行相关性分析,也掌握了根据题意需求去选择什么时候该什么样的分析进行数据统计分析,才能 将自己所想要的数据得到,并且进行分析数据的潜在意义。
一 实验目的
1.掌握线性回归分析、曲线估计、非线性回归分析的原理与步骤; 2.掌握线性回归分析、曲线估计、非线性回归分析的操作界面,并熟练; 3.学会对实例进行线性回归分析、曲线估计、非线性回归分析出来的结果进行思考以及分析。
二 实验内容
题目三:合金钢的强度 y 与钢材中碳的含量 x 有密切的关系,为了冶炼出符合要求强度的钢,常常通过 控制钢水中的碳含量来达到目的,因此需要了解 y 与 x 之间的关系,数据如表 9.27 所示,现对 x 和 y 进行一元线性回归分析。(数据文件为:data9-5.sav)
表 9.27 碳含量与钢强度数据 碳含量 0.03 0.04 0.05 0.07 0.09 0.1 0.12 0.15 0.17 0.2 钢强度 40.5 39.5 41 41.5 43 42 45 47.5 53 56
实验结果截图:
Descriptive Statistics Mean Y x 164.391 .18 Std. Deviation 396. N 11 11
Correlations Y Pearson Correlation Y x Sig. (1-tailed) Y x N Y x 1.000 .983 . .000 11 11 x .983 1.000 .000 . 11 11
Variables Entered/Removed Model 1 Variables Entered x
Variables Removed
. Enter 18
Variables Entered/Removed Model 1 Variables Entered x
Variables Removed
a. All requested variables entered. b. Dependent Variable: Y
Model Summary Std. Error R Model 1 R .983
Change Statistics R Square Change F Change df1 1 df2 9 Sig. F Change .000 Durbin-Watson .163
Adjusted R Square .962
of the Estimate 77.3073
Square .966
.966 253.845
a. Predictors: (Constant), x b. Dependent Variable: Y
ANOVA Model 1 Regression Residual Total a. Predictors: (Constant), x b. Dependent Variable: Y Sum of Squares
Mean Square 1 9 10
Coefficients Standardiz ed Unstandardize d Coefficients Std. Model 1 (Constan t) x B Error Beta t Coefficien ts Sig .
95% Confidence Interval for B Lower Bound -158.8 58
Upper Bound -30.29 2
.983 .983 .98 3 Correlations Zero-ord Partia Par er l t
Collinearity Statistics Toleran ce VIF
-94.57 28.41 5 7 .983
-3.32 .00 8 9
15.93 .00 3 0
a. Dependent Variable: Y
Coefficient Correlations Model 1 Correlations Covariances x x
Coefficient Correlations Model 1 Correlations Covariances a. Dependent Variable: Y x x
Collinearity Diagnostics
Variance Proportions Model 1 Dimension 1 2 a. Dependent Variable: Y Eigenvalue 1.572 .428 Condition Index 1.000 1.916 (Constant) .21 .79 x .21 .79
Residuals Statistics Minimum Predicted Value Residual Std. Predicted Value Std. Residual a. Dependent Variable: Y -52.269 -131.4671 -.556 -1.701 Maximum . 1.200
Mean 164.391 . .000
Std. Deviation 389.1 1.000 .949
N 11 11 11 11
实验结果分析:
从上述表中可以看出R=0. 983,自变量和因变量的相关性很强,且两者之间有96.6%的差异,可建立线 性模型。则该回归方程有意义:
y=-94.575+
题目四:某公司太阳镜销售情况如表8.17,销售量与平均价格、广告费用和日照时间之间的关系作多元
线性回归分析。(数据文件:data8-8.sav)
实验结果截图:
Variables Entered/Removed Model 1 Variables Entered 日照时间, 价格, 广告费用 a. All requested variables entered. b. Dependent Variable: 销量
Variables Removed
Model Summary Std. Error R Model R Square Adjusted R Square of the Estimate R Square Change 20
Change Statistics F Change df1 df2 Sig. F Change Durbin-Watson
.988 218.376
a. Predictors: (Constant), 日照时间, 价格, 广 告费用 b. Dependent Variable: 销量
ANOVA Model 1 Regression Residual Total Sum of Squares 9.896
Mean Square 3 8 11 4.987
a. Predictors: (Constant), 日照时间, 价格, 广告费用 b. Dependent Variable: 销量
Coefficients
Standardized Unstandardized Coefficients Model 1 (Constant) 价格 广告费用 日照时间 a. Dependent Variable: 销量 B 119.594 -12.163 2.319 13.231 Std. Error 29.373 4.399 .920 2.698 -.235 .292 .504 Coefficients Beta t 4.072 -2.765 2.522 4.905 Sig. .004 .024 .036 .001
Coefficient Correlations Model 1 Correlations 日照时间 价格 广告费用 Covariances 日照时间 价格 广告费用 a. Dependent Variable: 销量 日照时间
价格 .192 1.000 .492 2.274 19.348 1.989
广告费用 -.695 .492 1.000 -1.723 1.989 .846
1.000 .192 -.695 7.278 2.274 -1.723
Residuals Statistics Minimum Predicted Value Residual Std. Predicted Value Std. Residual a. Dependent Variable: 销量 73.28 -15.058 -1.403 -1.404 Maximum 315.79 18.663 1.527 1.740
Mean 189.42 .000 .000 .000
Std. Deviation 82.754 9.145 1.000 .853
N 12 12 12 12
实验结果分析:
从表中的相关系数可以看出三个自变量和因变量的关系均较密切,而且价格和销量的关系为负相关。因为从建立的那个模型与方差分析中,R 和 R 的平方均为很大和显著性概率明显小于 0.05,不仅可以看出 销量和三个自变量之间具有很强的线性关系,也可以看出所建立的模型存在显著性。所以,建立的回归方 程有意义,为:y=119.594-12.163x1+2.913x2+13.231x3 ;
题目五:研究青春发育阶段的年龄与远视率的变化关系,测得数据如表 9.28 所示,请对 x 与 y 的关系进
行曲线估计。(数据来源: 《统计学(第二版) 袁卫,高等教育出版社;数据文件:data9-6.sav) 》
表 9.28 青春发育阶段年龄与远视率的变化关系 年龄(x) 6 7 8 9 10 11 12 13 14 15 16 17 18
远视率(y) 63.64 61.06 38.84 13.75 14.5 8.07 4.41 4.27 2.09 1.02 2.51 3.12 2.98
实验结果截图:
Model Description Model Name Dependent Variable Equation 1 1 2 Independent Variable Constant Variable Whose Values Label Observations in Plots MOD_1 远视率 Linear S
年龄 Included Unspecified
a. The model requires all non-missing values to be positive.
Case Processing Summary N Total Cases Excluded Cases
Forecasted Cases Newly Created Cases a. Cases with a missing value in any
variable are excluded from the analysis.
Variable Processing Summary Variables Dependent 远视率 Number of Positive Values Number of Zeros Number of Negative Values Number of Missing Values User-Missing System-Missing 13 0 0 0 0 Independent 年龄 13 0 0 0 0
Model Summary and Parameter Estimates Dependent Variable:远视率 Model Summary Equation Linear S R Square .674 .877 F 22.710 78.119 df1 1 1 df2 11 11 Sig. .001 .000 Parameter Estimates Constant 74.006 -1.502 b1 -4.768 37.175
The independent variable is 年龄.
实验结果分析:
从表中可看出:所有模型的拟合优度值 R 的平方的比较,可以看出 三次曲线 cubic 的 R 的平 方最大,效果最好,并且显著性水平为 0。而在优度表中我们可以看出相关系数 R 和 R 的平 方以及校正后 R 的平均值均很大,分别为:0.979,0.959,0.945;所以我们可以判断原始率和发育 阶段的年龄之间有较显著的三次曲线关系。而且,在方差分析表中,它的相伴概率 sig.=0.000 也说明了这个模型具有显著的统计意义。题目六:棉花单株在不同时期的成铃数(y)与初花后天数(x)存在非线性的关系,假设这一非线性关
系可用 Gompertz 模型表示:y=b1*exp(-b2*exp(-b3*x))。某一棉花品种 7 月 5 日至 9 月 3 日每隔 5 天的单株成铃数观测值如表 9.29 所示。试根据观测值拟合模型中的参数。(数据来源: 《线性模型
分析原理》朱军,科学出版社;数据文件为:data9-7.sav) 表 9.29 棉花成铃数观测数据表 天数 成铃数 5 0.75 10 2 15 4 20 25 30 35 40 45 50 55 60 65
4.75 4.25 5.5 7.75 10.13 14.26 13.14 13.52 14.15 14.53
Iteration History
Residual Sum of Iteration Number 0.1 1.1 2.1 3.1 4.1 5.1 6.1 7.1 8.1 9.1 10.1 11.1 12.1 13.1 14.1 15.1 16.1 17.1 18.1 19.1 20.1 21.1 22.1
Parameter b1 5.000 8.287 8.287 8.287 8.281 10.315 10.393 16.336 16.290 15.735 15.756 16.099 17.150 17.119 17.282 17.882 18.607 18.777 18.980 19.027 19.028 19.028 19.028 b2 3.000 3.000 3.194 3.194 3.325 3.969 4.118 6.185 6.242 4.854 4.243 3.986 3.628 3.556 3.826 3.661 3.493 3.505 3.496 3.484 3.486 3.486 3.486 b3 3.000 3.000 .104 .104 .107 .092 .090 .063 .066 .061 .058 .054 .047 .047 .049 .046 .043 .043 .042 .042 .042 .042 .042
Squares 428.418 287.968 156.395 156.395 156.252 75.219 72.416 15.264 14.390 10.363 9.671 8.722 8.059 7.569 7.323 6.972 6.816 6.772 6.764 6.763 6.763 6.763 6.763
Derivatives are calculated numerically. a. Major iteration number is displayed to the left of the decimal, and minor iteration number is to the right of the decimal. b. Run stopped after 22 iterations. Optimal solution is found.
Parameter Estimates 95% Confidence Interval Parameter b1 b2 b3 Estimate 19.028 3.486 .042 Std. Error 2.521 .449 .008 Lower Bound 13.410 2.487 .023 Upper Bound 24.645 4.486 .061
Correlations of Parameter Estimates b1 b1 b2 b3 1.000 -.611 -.945 b2 -.611 1.000 .815 b3 -.945 .815 1.000
ANOVA Source Regression Residual Uncorrected Total Corrected Total Dependent variable: Y
Sum of Squares .763 .968
df 3 10 13 12
Mean Squares 391.318 .676
a. R squared = 1 - (Residual Sum of Squares) / (Corrected Sum of Squares) = .977.
实验结果分析:
从表中我们又可以得到模型所不能解释的变异信息、全部变异之和、以及与因变量平均 值的差异等;且,从脚注又可以看出它们的复相关系数的平方和为 0.977,也说明了这个模型 能够解释因变量 97.7%的变异,所以这个模型的非线性估计的效果不错。因此,这个模型具 有了的分析统计意义。模型可为:Y=19.028*exp(-3.486 * exp(-0.42 * X)) ;
三、心得与体会 通过这次线性回归分析实践,我掌握线性回归分析、曲线估计、非线性回归分析的原理与 步骤、操作界面,也学会对实例进行线性回归分析、曲线估计、非线性回归分析出来的结果 进行思考以及分析。实践不仅能够让我们自己把脑海里的理论知识巩固和深入了解,也可以 帮助我们在学习的过程中更好的去接触新事物,并加以掌握。
25第一篇:spss实验报告心得应用―― SPSS 应用―― 实验报告
级:统计 0801 班 号: 名: 宋 磊
指导老师:胡 朝 明 指导老师:
一、实验目的: 实验目的: 实验目的
1、熟悉 SPSS 操作系统,掌握数据管理界面的简单的操作; 2、熟悉 SPSS 结果窗口的常用操作方法,掌握输出结果在文字处理软件中的使用 方法。掌握常用统计图(线图、条图、饼图、散点、直方图等)的绘制方法; 3、熟悉描述性统计图的绘制方法; 4、熟悉描述性统计图的一般编辑方法。掌握相关分析的操作,对显著性水平的 基本简单判断。
二、实验要求: 实验要求:
1、数据的录入,保存,读取,转化,增加,删除;数据集的合并,拆分,排序。2、了解描述性统计的作用,并掌握其 SPSS 的实现(频数,均值,标准差,中位 数,众数,极差) 。3、应用 SPSS 生成表格和图形,并对表格和图形进行简单的编辑和分析。4、应用 SPSS 做一些探索性分析(如方差分析,相关分析) 。
三、实验内容: 实验内容:
1、使用 SPSS 进行数据的录入,并保存: 职工基本情况数据:
职工号 1 2 3 4 5 6 7 8 9 10 11
性别 1 1 1 1 1 2 2 2 2 1 1
年龄 48 42 54 41 38 41 42 41 42 35 56
基本工资 4 835 848 824 824 824 859 827 1014
职称 1 2 1 3 3 4 4 4 2 3 1
学历 1 2 3 3 1 3 3 3 2 1 2
失业保险 12 9 13 8 8 7 7 7 8 7 12
12 13 14 15 16
59 59 41 55 45
989 938 889 887 887
操作步骤如下: 打开 SPSS 软件,然后在数据编辑窗口(Data View)中录入数据,此时变量名默 认为 var00001,var00002,…,var00007,然后在 Variable View 窗口中将变量名 称更改即可。具体结果如下图所示:
输入后的数据为:
将上述的数据进行保存:
单击保存即可。2、读取上述保存文件: 选择菜单 File--Open―Data;选择数据文件的类型,并输入文件名进行读取, 出现如下窗口:
选定职工基本情况.sav 文件单击打开即可读取数据。3、对上述数据新增一个变量工龄,其操作步骤为将当前数据单元确定在某变量 上,选择菜单 Data―Insert Variable,SPSS 自动在当前数据单元所在列的前一 列插入一个空列,该列的变量名默认为 var00016,数据类型为标准数值型,变 量值均是系统缺失值,然后将数据填入修改。结果如下图所示:
Var00016 为新增加的变量; 4、对上述进行数据转化: 操作步骤为 Data―Transpose,显示窗口如下:
然后单击 Ok 可以得到结果:
5、在上述数据中删除一个变量,过程如下:在欲删除的变量名上单击右键,从 弹出菜单中选择 cut 选项,该列即被删除。如删除年龄后的数据为:
6、将如下数据与上述数据进行纵向合并: 职工号 17 18 19 20 21 性别 2 1 2 1 1 职称 1 1 2 2 3 失业保险 11 9 12 8 10
具体操作步骤为:在数据编辑窗口中打开一个需要合并的 SPSS 数据文件,选择 菜单 Data―Merge File―Add Cases 弹出 Add Cases:Read File 对话框,然后 确定盘符、路径、文件名后点击 OK,即完成合并。过程操作图如下:
结果如下:
将如下数据与初始数据进行横向合并: 职工号 1 3 奖金
具体操作步骤同纵向合并,过程操作图如下:
得到结果为:
7、数据的拆分 操作步骤为,选择菜单 Data―Spilt File 显示如下窗口:
所得到的结果如下:
8、1 中录入的数据进行排序,操作步骤为: 选择菜单 Data―Sort Cases,如下所示:
单击 OK 对基本工资进行升序排列得到结果如下:
9 用 SPSS 对职工基本情况的原始数据进行作图,操作步骤为: Graphs―Legacy Dialogs 选择相应的柱形图,饼图或者折线图。以饼图为例, 单击 Pie 显示如下窗口:
单击 Define,结果如下:
以学历为例,得出饼图:
若要画柱图,则点击 Bar 显示如下对话框:
单击 Define 然后选定主要量,单击 OK 即可得到柱形图:
10、用 SPSS 求解上述数据中职工的频数,均值,标准差,中位数,众数,极差, 操作步骤为:点击菜单 Analyze―Descriptive statistic―Frequencies 即可打 开下面窗口:
以基本工资为例,点击 Statistics,进入如下窗口:
最后单击 OK 便可得到所求结果:
从此表中可以看出职工基本工资的均值是 905.4375, 中位数是 887, 众数是 824, 标准差是 79.33135,极差是 220,各个基本工资的频数如下所示:
11、研究 50 只灯泡的耐用时数(小时)如下表: 886 928 999 946 950 864
905 954 890
900 800 938 864 919 946 926 895 967 921 978 用 SPSS 画出频数表和图 操作步骤如下:点击菜单 Analyze―Descriptive 后单击 Statistics..按钮,出现如下对话框: 0 863 821 927 854 999 981 924 949
651 852 900
Statistic―Frequencies,然
可点击相应的项目,要求系统球出相应的结果。选好后点击 Continue 返回 Frequencies 对话框,然后点击 Charts..,出现如下 窗口:
可 以 选 择 直 条 图 ( Bar chart ) 适 用 于 非 连 续 的 变 量 ; 另 一 种 是 直 方 图 , (Histograms) ,适用于连续型变量。本例要求选择 Histograms 选项,并按要求 绘制正态曲线(With normal curve)点击 Continue 返回,最后单击 OK 得出结 果如下:
从这个表中可以知道一些基本的统计指标, 例如: 众数, 中位数, 总和, 标准差, 方差,极差等等。
上表为对变量灯泡时数所做的频数分布表,其中 Frequency 为频数、Percent 为 各组频数占总例数的百分比、 Valid Percent 为各组频数占总例数的有效百分比、 Cum Percent 为各组频数占总例数的累积百分比。最后输出直方图和带有正态曲线的直方图:
从上述两个柱形图中可以看出灯泡时数基本呈正态分布。12、单因素方差分析: 某企业广告形式和地区对销售额的影响,见下表: 广告形式 1 2 4 3 1 2 4 3 1 2 4 3 地区 1 1 1 1 2 2 2 2 3 3 3 3 销售额 75 69 63 52 57 51 67 61 76 100 85 61 广告形式 1 2 4 3 1 2 4 3 1 2 4 3 地区 4 4 4 4 5 5 5 5 6 6 6 6 销售额 77 90 80 76 75 77 87 57 72 60 62 52 广告形式 1 2 4 3 1 2 4 3 1 2 4 3 地区 7 7 7 7 8 8 8 8 9 9 9 9 销售额 52 76 33 70 33 81 79 75 69 63 73 40 广告形式 1 2 4 3 1 2 4 3 1 2 4 3 地区 10 10 10 10 11 11 11 11 12 12 12 12 销售额 60 94 100 64 61 54 61 40 70 68 67 66 其中广告形式中(1 表示报纸,2 表示广播,3 表示宣传品,4 表示体验) 具体操作步骤如下: 选择菜单 Analyze--Compare means--one--Way ANOVA,出现下面所示窗口:
然后选择观测变量到 Dependent List 框;选择控制变量到 Factor 框,最后单击 OK 即可得到分析结果。本例最后结果如下: 广告形式对销售额的单因素方差分析结果
上述结果显示了组间、 组内和合计的自由度 (df) 离均差平方和 、 (Sum of Squares) 、 均方差 (Means Square)F 值 、 (F) P 值 和 (Sig)从上述的结果中可以看出 F=2.084, 。P=0.116.说明广告形式对销售额的影响程度比较大。地区对销售额的单因素方差分析结果
根据上面的方法同理即可进行结果分析。
13、相关分析: 为研究高等院校人文社会科技研究中立项课题数会受哪些因素的影响收集到 31 各省市自治区部分高校有关社科研究方面的数据, 研究立项课题数与投入的具有 高级职称的人年数之间是否有较强的线性关系。具体数据见下面表格:
首先利用 SPSS 绘制散点图,其操作步骤为:选择菜单 Graphs―Scatter 出现下 列窗口:
单击 Define:
Y 轴为投入高级职称的人年数,X 轴为课题总数点击 OK 得出散点图:
然后做相关分析,步骤为:Analyze―Correlate―Bivariate 出现如下窗口:
选择需要的因素,单击 Options,得出:
点击 Continue 返回,单击 OK 即可得出结果:
由上表可看出上网时间和零花钱的相关性非常大,因为二者的简单相关系数为 0.944,而 Sig 的值约等于 0。
14、利用 SPSS 进行回归分析和残差分析: 依据题 13 中搜集的数据进行线性回归分析,此题中被解释变量为立项课题数, 解释变量为投入人年数,投入高级职称的人年数,投入科研事业费,专著数,论 文数,获奖数。具体操作步骤如下: 选择菜单 Analyze―Regression―Linear,得到下面窗口:
选择变量进入相应的对话框,点击 OK 得出如下结果:
上述表格表示所选变量入选
表中的各列数据项的含义依次为:被解释变量和解释变量的复相关系数,判定系
数 R 2 ,调整的判定系数 R ,回归方程的估计标准差。
可以看出:被解释变量的总离差平方和为 2.1× 10 ,回归平方和及均方分别为
1.9 ×107 和
,剩余平方和及均方分别为 1435825 和
F 检验统计量的观测值为 123.113 ,对应的概率 p 值近似为 0.由该表可知可进行 回归方程的显著性检验。
从此表中可以看出 t 值均大于显著性水平,因此目前该模型是不可用的,应该重 新考虑。采用向后筛选策略让 SPSS 软件自动完成解释变量的选择,观测每一步 检验的变化情况,并进行残差分析和强影响点探测。分析结果如下:
从上面三个表格中可以看出只有投入人年数的回归系数显著性检验的概率 P 小 于显著性水平,因此将它保留在模型中是合理的。最终的回归方程是:立项课题 数=-94.524+0.492 投入人年数,说明投入人年数增加一个单位会使立项课题数 平均增加 0.429 个单位。
上述图形是其残差分析图,数据点围绕基准线还存在一定的规律性,可以认为残 差满足了线性模型的前提要求。
四、试验心得: 试验心得:
本次 SPSS 课程实践让我对这门软件有了较深刻的认识,SPSS 是一款菜单式
的软件,操作简便,易于理解。实践过程中我掌握如何利用 SPSS 进行数据简单 处理,制图以及进行各种数据分析,包括相关性分析,回归分析以及残差分析等 等,让我认识到 SPSS 对解决简单的实际问题有很大的帮助。实践过程中由于缺 少数据, 大部分表格都是从教材中搜集的, 在对结果分析中我做的还不是很完善, 希望老师能够予以指导, 我会在以后的学习中继续加深自己对这门软件的掌握和 理解,做到学以致用。
第一篇:spss实验报告心得实 验 报 告
实验课程 上课时间 学生姓名 所在学院 经管学院
Spss 统计分析 2012 学年 下 学期 15、16 学号 上课地点 ERP 实验室 周 ( 2012 年 12 月 18 班级 指导教师 日― 28 日)
第六章方差分析实验报告
一、实验目的
掌握方差分析的相关统计分析方法原理,通过上机练习,用单因素方差分析、多因素方 差分析以及协方差分析等方法来对我们生活中的实际问题进行分析, 真正达到理论和实践相 结合的学习目的。
二、实验内容
1、解决问题的实验原理
方差分析的基本原理是认为不同处理组的均值间的差别基本来源有两个: A、随机误差,如测量误差造成的差异或个体间的差异,称为组内差异 B、实验条件,即不同的处理造成的差异,称为组间差异。
2、实验过程的相关步骤
第五题实验步骤及结果分析: 第一步:打开数据文件 data6―7.sav;
第二步:选择菜单“分析――均值比较――单因素 ANOVA” ,打开如图所示的“单因素方 差分析”对话框,将“亩产量”导入因变量列表, “品种”选入因子;
第三步:单击“对比”按钮进行设置(本题无需设置) ;单击“两两比较”按钮进行设置(如 下图) ;
第四步:单击“选项”按钮进行设置,选择“方差同质性检验” ,如图;
第五步:最后单击“确定”按钮导出分析结果。
实验结果分析:
通过方差分析的多重比较结果, 分别对油菜品种进行了两两比较, 整个表反映出不同品 种油菜的平均产量有显著性差异。
第六题实验步骤及结果分析: 该题实验步骤同样采用第五题所用的单因素方差分析方法(如图)
导出实验结果: (如下图)
实验结果分析:
此题同样运用了单因素方差分析法, 通过方差分析的多重比较结果, 分别对轮胎类型进 行两两比较,整个表反映出在显著水平 0.05 下不同类型轮胎寿命间存在显著差异。第七题实验步骤及结果分析 第一步:打开数据文件 data6―9.sav;
第二步:选择菜单“分析――一般线性模型――单变量” ,打开如图所示的“单变量”对话 框,将“销量”选入因变量, “包装”和“摆放位置”选入固定因子;
第三步:单击“模型”按钮,弹出如图对话框,选择“全因子”等进行设置;
第四步:单击“对比”按钮,将更改对比中的“对比”改为“简单” ,进行如图设置;
第五步:单击“绘制”按钮,将“casing”选入水平轴、 “place”选入单图,然后单击“添 加”按钮添加到文本框中,单击“选项”按钮,勾选“方差齐性检验” ;
第六步:单击“两两比较”按钮,进行与第六题相同的设置(图略) ,最后完成如上设置后 单击“确定”按钮,得到结果。(如下图)
实验结果分析:
通过多因素方差分析检验结果表和交互影响折线图所显示的结果,不同包装、摆放位 置的离差平方和、均方都比较大,这说明两者对销量均有影响,而通过多重比较结果显示,
在显著水平 0.05 下商品包装、摆放位置及其搭配对销售情况具有显著影响。
第八题实验步骤及结果分析 第一步:打开数据文件 data6--10.sav;
第二步:选择菜单“分析――般线性模型――单变量” ,弹出如图对话框,将“生长量”选 入因变量, “氮肥量”“钾肥量”选入固定因子, 、 “初始高度”选入协变量;
第三步: “模型” 单击 按钮, “设定” 选中 单选框自定义方差分析模型, “N” 将 、 、 “K” “height” 和“N*K*height”移入模型中;
第四步:单击“选项”按钮,选中“方差齐性检验”进行设置,第一次导出结果后再同上一 步,只是在“模型”对话框之“设定”的“模型”中不再选择“N*K*height” ; 第五步:最后,完成如上设置后单击“确定”按钮得到结果。
实验结果分析:
经过最后所得到的协方差的主要结果可知, 氮肥量、 钾肥量及树苗初始高度对杨树的生 长无显著影响。
三、实验心得体会
我们的这次实验安排在第十五,十六周,临近期末,我们几乎每天都要和spsss实验课 打交道, 因为 担心期末考试, 连续两周的课程和各种课程再加上自己上自习进行期末复习, 确实让人神经有点紧张。但是,在实验过程中,我也找到了很多乐趣,使我无聊的期末复习 不再那么枯燥。此次实验课见识到了统计软件功能的强大, 平时很多数据处理问题在这个工 具面前都显得是那么的简单。
第七章相关分析实验报告
一、实验目的
学习和运用多元统计分析模型和方法, 本章主要是通过相对简单的多元分析法――相关 分析,加深我们对 spss 的学习和理解,达到学以致用的买的。
二、实验内容
1、实验相关原理
a、二元定距变量的相关分析 :定距变量又称为间隔(interval)变量(即连续属性变量) , 变量值之间可以比较大小,可以用加减法计算出差异的大小。Pearson 简单相关系数及 t 统计量:
r n?2 t ? 1? r2 b、偏相关分析:控制一个变量和控制两个变量的偏相关系数分别为: ? ( xi ? x) 2 ? ( yi ? y ) 2
i ?1 i n n i ?1 i ?1
? x )( yi ? y )
(1 ? rxz ) (1 ? ryz 2、实验内容及其实验结果分析)
rxy ? rxz ryz
rxy , z1z2 ?
rxy , z1 ? rxz1, z2 ryz2 , z1
2 2 (1 ? rxz1 , z2 ) (1 ? ryz2 , z1 )
第三题实验步骤及其实验结果分析:
第一步:打开数据文件data7-9.sav;
第二步:选择菜单“分析――相关――双变量” ,打开如图所示的对话框,将“花瓣长” 和“花枝长”选入变量框中, “相关系数”选择Pearson, “显著性检验”选择双侧 检验;
第三步:单击“选项”按钮,弹出如图所示的对话框,选择“统计量”下的两项:均值和标
准差、叉积偏差和协方差;
第四步:最后,完成以上设置后,单击“确定”按钮,得到结果;
第五步:如上步骤 2~4,分别将“花瓣长”“花萼长”和“花枝长”“花萼长”选入变量框 、 、 中,其余步骤均不作改变,得到另外两个结果如图。
实验结果分析:
根据结果图表不难看出,相关系数 0.955 大于 0,呈正相关,相关系数的显著性为 0 小 于 0.05,因此拒绝原假设,即说明花瓣长与花枝长显著相关;花瓣长与花萼长、花枝长与 花萼长也同理可得显著相关。
第四题实验步骤及实验结果分析:
第一步:打开数据文件 data7-10.sav;
第二步:选择菜单“分析――相关――双变量” ,打开如图所示的对话框,将“国民收入” 和“存款余额”选入变量框中, “相关系数”选择 Spearman, “显著性检验”中选 择双侧检验;
第三步:最后,完成上述设置后,单击“确定”按钮,得到结果。
结果分析:
通过结果图表可以看出,相关系数分别为 1 和 0.995,均大于 0,说明呈正相关,拒绝 原假设,说明国民收入和存款余额是显著相关的。
第五题实验步骤及其实验结果分析:
第一步:打开数据文件 data7-11.sav;
第二步:选择菜单“分析――相关――双变量”,弹出如图所示的对话框,将“百米名次” 和 “跳高名次” 选入变量框中, “相关系数” 选择 Kendall 的 tau-b (k) Spearman, 和 “显著性检验”选择双侧检验;
第三步:最后,完成上述设置后,单击“确定”按钮,得到结果。
结果分析:
从结果图表可以看出,两变量的 Kendall 相关系数为 1 和 0.467,双尾检测的相伴概率 为 0.060 大于 0.05,不能拒绝原假设,则两变量不显著相关;两变量的 Spearman 相关系数 为 1 和 0.697,均大于 0,双尾检测相伴概率为 0.025 小于 0.05,拒绝原假设,说明两变量 显著相关。
第六题实验结果及其实验结果分析:
第一步:打开数据文件 data7-12.sav;
第二步:选择菜单“分析――相关――偏相关” ,弹出如图所示的对话框,将“销量”“价 、 格”选入变量框中, “广告费用”“日照时间”选入控制框中(分析销量与价格之 、 间的关系)“显著性检验”选择双侧检验; ,
第三步:最后,完成上述设置后,单击“确定”按钮,得到结果;
第四步:重复上述步骤二~三,只是在第二步时分别将“销量”“广告费用”选入变量框中, 、 “价格”“日照时间”选入控制框中(分析销量与广告费用之间的关系) 、 ,将“销 量”“日照时间”选入变量框中, 、 “价格”“广告费用”选入控制框中(分析销量 、 与日照时间之间的关系) 。
结果分析:
从结果图表中可以看出,销量与价格密切相关,相关系数为 0.699,双尾检测相伴概率 为 0.024 小于 0.05,拒绝原假设,说明销量与价格显著相关;同理分析可得,销量与广告 费用和日照时间都是显著相关的。
三、实验心得体会
本次实验相对前几次较为简单,虽然以前统计学理论知识中,对相关也有了解,大师这 次实验还是加深了我对相关分析的原理的理解和练习。这次实验再次让我感觉到了 spss 功 能的强大,它给我们在以后的生活中处理相关数据问题提供了很多方法。Spss 实验课是一 门实践性、操作性极强的课程,我感觉到如果自己下来也认真练习,加上认真上课,认真学 习 spss 的实务,对以后找工作肯定可以有帮助。
版权所有&&&教师资格考试门户网站,全面发布教师资格证考试时间、教师资格证考试科目、教师资格考试必备资料等&教师联盟-中小学教师资格考试

我要回帖

更多关于 spss做性别相关性分析 的文章

 

随机推荐