2x2列联表的excel相关系数公式计算公式

SPSS交叉列联表分析
原文配图,见
spss交叉列联表分析
在实际分析中,除了需要对单个变量的数据分布情况进行分析外,还需要掌握多个变量在不同取值情况下的数据分布情况,从而进一步深入分析变量之间的相互影响和关系,这种分析就称为交叉列联表分析。
当所观察的现象同时与两个因素有关时,如某种服装的销量受价格和居民收入的影响,某种产品的生产成本受原材料价格和产量的影响等,通过交叉列联表分析,可以较好地反映出这两个因素之间有无关联性及两个因素与所观察现象之间的相关关系。
因此,数据交叉列联表分析主要包括两个基本任务:一是根据收集的样本数据,产生二维或多维交叉列联表;二是在交叉列联表的基础上,对两个变量间是否存在相关性进行检验。要获得变量之间的相关性,仅仅靠描述性统计的数据是不够的,还需要借助一些表示变量间相关程度的统计量和一些非参数检验的方法。
常用的衡量变量间相关程度的统计量是简单相关系数,但在交叉列联表分析中,由于行列变量往往不是连续变量,不符合计算简单相关系数的前提条件。因此,需要根据变量的性质选择其他的相关系数,如Kendall等级相关系数、Eta值等。
SPSS提供了多种适用于不同类型数据的相关系数表达,这些相关性检验的零假设都是:行和列变量之间相互独立,不存在显著的相关关系。根据SPSS检验后得出的相伴概率(Concomitant
Significance)判断是否存在相关关系。如果相伴概率小于显著性水平0.05,那么拒绝零假设,行列变量之间彼此相关;如果相伴概率大于显著性水平0.05,那么接受原假设,行列变量之间彼此独立。
在交叉列联表分析中,SPSS所提供的相关关系的检验方法主要有以下3种:
(1)卡方(χ2)统计检验:常用于检验行列变量之间是否相关。计算公式为:
其中,f0表示实际观察频数,fe表示期望频数。
卡方统计量服从(行数 1) (列数
1)个自由度的卡方统计。SPSS在计算卡方统计量时,同时给出相应的相伴概率,由此判断行列变量之间是否相关。
(2)列联系数(Contingency
coefficient):常用于名义变量之间的相关系数计算。计算公式由卡方统计量修改而得,公式如下:
(3) 系数(Phi and Cramer's
V):常用于名义变量之间的相关系数计算。计算公式由卡方统计量修改而得,公式如下:
系数介于0和1之间,其中,K为行数和列数较小的实际数。
交叉列联表分析的具体操作步骤如下:
打开数据文件,选择【分析】(Analyze)菜单,单击【描述统计】(Descriptive
Statistics)命令下的【交叉表】(Crosstabs)命令。"交叉表"(Crosstabs)主对话框如图3-13所示。
在该主对话框中,左边的变量列表为原变量列表,通过单击
按钮可选择一个或者几个变量进入右边的"行"(Row(s))变量列表框、"列"(Column(s))变量列表框和"层"(Layer)变量列表框中。
如果是二维列联表分析,只需选择行列变量即可,但如进行三维以上的列联表分析,可以将其他变量作为控制变量选到"层"(Layer)变量列表框中。有多个层控制变量时,可以根据实际的分析要求确定它们的层次,既可以是同层次的也可以是逐层叠加的。
在"交叉表"对话框底端有两个可选择项:
显示复式条形图(Display clustered bar chart):指定绘制各个变量不同交叉取值下关于频数分布的柱形图;
取消表格(Suppress
table):不输出列联表的具体表格,而直接显示交叉列联表分析过程中的统计量,如果没有选中统计量,则不产生任何结果。所以,一般情况下,只有在分析行列变量间关系时选择此项。
该对话框的右端有4个按钮,从上到下依次为【精确】(Exact)按钮、【统计量】(Statistics)按钮、【单元格】(Cells)按钮和【格式】(Format)按钮。单击可进入对应的对话框。
单击【精确】(Exact)按钮,打开"精确检验"(Exact Tests)对话框,如图3-14所示。
该对话框提供了3种用于不同条件的检验方式来检验行列变量的相关性。用户可选择以下3种检验方式之一:
仅渐近法(Asymptotic only):适用于具有渐近分布的大样本数据,SPSS默认选择该项。
Carlo(蒙特卡罗法):此项为精确显著性水平值的无偏估计,无需数据具有渐近分布的假设,是一种非常有效的计算确切显著性水平的方法。在"置信水平"(Confidence
Level)参数框内输入数据,可以确定置信区间的大小,一般为90、95、99。在"样本数"(Number of
samples)参数框中可以输入数据的样本容量。
精确(Exact):观察结果概率,同时在下面的"每个检验的时间限制为"(Time limit per
test)的参数框内,选择进行精确检验的最大时间限度。
用户在本对话框内进行选择后,单击【继续】(Continue)按钮即可返回"交叉表"主对话框。一般情况下,"精确检验"(Exact
Tests)对话框的选项都默认为系统默认值,不作调整。
单击【统计量】(Statistics)按钮,打开"交叉表:统计量"(Crosstabs:Statistics)对话框,如图3-15所示。
在该对话框中,用户可以选择输出合适的统计检验统计量。对话框中各选项的意义如下:
(1)卡方(Chi-square)检验复选框:检验列联表行列变量的独立性检验,也被称为Pearson
chi-square检验、χ2检验。
(2)相关性(Correlations)检验复选框:输出列联表行列变量的Pearson相关系数或Spearman相关系数。
(3)名义(Nominal)栏:适用于名称变量统计量。
相依系数(Contingency coefficient):即Pearson相关系数或Spearman相关系数。
Phi 和Cramer变量(
系数):常用于名义变量之间的相关系数计算。计算公式由卡方统计量修改而得,如公式(3.13)所示。ψ系数介于0和1之间,其中,K为行数和列数较小的实际数。
Lambda(λ系数):在自变量预测中用于反映比例缩减误差,其值为1时表明自变量预测因变量好,为0时表明自变量预测因变量差。
不定性系数(Uncertainty
coefficient):以熵为标准的比例缩减误差,其值接近1时表明后一变量的信息很大程度上来自前一变量,其值接近0时表明后一变量的信息与前一变量无关。
(4)有序(Ordinal)栏:适用于有序变量的统计量。
Gamma(伽马系数,γ系数):两有序变量之间的关联性的对称检验。其数值界于0和1之间,所有观察实际数集中于左上角和右下角时,取值为1,表示两个变量之间有很强的相关;取值为0时,表示两个变量之间相互独立。
Somers'd值:两有序变量之间的关联性的检验,取值范围为[-1,1]。
tau-b值:考虑有结的秩或等级变量关联性的非参数检验,相同的观察值选入计算过程中,取值范围为[-1,1]。
tau-c值:忽略有结的秩或等级变量关联性的非参数检验,相同的观察值不选入计算过程,取值范围界为[-1,1]。
(5)按区间标定(Nominal by interval)栏:适用于一个名义变量与一个等距变量的相关性检验。
Kappa系数:检验数据内部的一致性,仅适用于具有相同分类值和相同分类数量的变量交叉表。
Eta值:其平方值可认为是因变量受不同因素影响所致方差的比例。
风险(相对危险度):检验事件发生和某因素之间的关联性。
McNemar检验:主要用于检验配对的资料率(相当于配对卡方检验)。
(6)Cochran's and
Mantel-Haenszel统计量复选框:适用于在一个二值因素变量和一个二值响应变量之间的独立性检验。
用户在"交叉表:统计量"对话框中进行选择后,单击【继续】(Continue),即可返回"交叉表"(Crosstabs)主对话框。一般情况下,对"交叉表:统计量"对话框内的选项不作选择或选择较为常用的卡方检验。
单击【单元格】(Cells)按钮,打开"交叉表:单元显示"(Crosstabs:Cell
Display)对话框,如图3-16所示。
在该对话框中,用户可以指定列联表单元格中的输出内容。SPSS17.0默认在交叉列联表中输出实际的观察值,但观察值有时候不能确切地反映事物的实质,因此还需要输出其他的数据项。对话框中各选项的具体意义如下:
(1)计数(Counts)栏:
观察值(Observed):系统默认选项,表示输出为实际观察值。
期望值(Expected):表示输出为理论值。
(2)百分比(Percentages)栏:
行(Row)百分比:以行为单元,统计行变量的百分比。
列(Column)百分比:以列为单元,统计列变量的百分比。
总计(Total)百分比:行列变量的百分比都进行输出。
(3)残差(Residuals)栏:
未标准化(Unstandardized):输出非标准化残差,为实际数与理论数的差值。
标准化(Standardized):输出标准化残差,为实际数与理论数的差值除以理论数。
调节的标准化(Adjusted standardized):输出修正标准化残差,为标准误确定的单元格残差。
(4)非整数权重(Noninteger Weights)栏:
四舍五入单元格计数(Round cell counts,系统默认):将单元格计数的非整数部分的尾数四舍五入为整数。
截短单元格计数(Truncate cell counts):将单元格计数的非整数部分的尾数舍去,直接化为整数。
四舍五入个案权重(Round case Weights):将观测量权数的非整数部分的尾数四舍五入为整数。
截短个案权重(Truncate case Weights):将观测量权数的非整数部分的尾数舍去,化为整数。
无调节(No adjustments):不对计数数据进行调整。
用户在"交叉表:单元显示"对话框中进行选择后,单击【继续】(Continue)按钮,即可返回"交叉表"主对话框。一般情况下,对"交叉表:单元显示"对话框的选项都默认为系统默认值,不作调整。
单击【格式】(Format)按钮,打开"交叉表:表格格式"(Crosstabs:Table
Format)对话框,如图3-17所示。
在该对话框中,用户可以指定列联表的输出排列顺序。对话框中各选项的具体意义如下:
在行序(Row Order)栏中有如下两个选项:
升序(Ascending):系统默认,以升序显示各变量值;
降序(Descending):以降序显示各变量值。
用户在该对话框中进行选择后,单击【继续】(Continue)按钮,即可返回"交叉表"主对话框。
在"交叉表"对话框中单击【确定】(OK)按钮,可在输出窗口中得到数据概述、交叉列联表、卡方检验表、交叉分组下频率分布柱形图、相对危险性估计等图表。
spss交叉列联表分析
在实际分析中,除了需要对单个变量的数据分布情况进行分析外,还需要掌握多个变量在不同取值情况下的数据分布情况,从而进一步深入分析变量之间的相互影响和关系,这种分析就称为交叉列联表分析。
当所观察的现象同时与两个因素有关时,如某种服装的销量受价格和居民收入的影响,某种产品的生产成本受原材料价格和产量的影响等,通过交叉列联表分析,可以较好地反映出这两个因素之间有无关联性及两个因素与所观察现象之间的相关关系。
因此,数据交叉列联表分析主要包括两个基本任务:一是根据收集的样本数据,产生二维或多维交叉列联表;二是在交叉列联表的基础上,对两个变量间是否存在相关性进行检验。要获得变量之间的相关性,仅仅靠描述性统计的数据是不够的,还需要借助一些表示变量间相关程度的统计量和一些非参数检验的方法。
常用的衡量变量间相关程度的统计量是简单相关系数,但在交叉列联表分析中,由于行列变量往往不是连续变量,不符合计算简单相关系数的前提条件。因此,需要根据变量的性质选择其他的相关系数,如Kendall等级相关系数、Eta值等。
SPSS提供了多种适用于不同类型数据的相关系数表达,这些相关性检验的零假设都是:行和列变量之间相互独立,不存在显著的相关关系。根据SPSS检验后得出的相伴概率(Concomitant
Significance)判断是否存在相关关系。如果相伴概率小于显著性水平0.05,那么拒绝零假设,行列变量之间彼此相关;如果相伴概率大于显著性水平0.05,那么接受原假设,行列变量之间彼此独立。
在交叉列联表分析中,SPSS所提供的相关关系的检验方法主要有以下3种:
(1)卡方(χ2)统计检验:常用于检验行列变量之间是否相关。计算公式为:
其中,f0表示实际观察频数,fe表示期望频数。
卡方统计量服从(行数 1) (列数
1)个自由度的卡方统计。SPSS在计算卡方统计量时,同时给出相应的相伴概率,由此判断行列变量之间是否相关。
(2)列联系数(Contingency
coefficient):常用于名义变量之间的相关系数计算。计算公式由卡方统计量修改而得,公式如下:
(3) 系数(Phi and Cramer's
V):常用于名义变量之间的相关系数计算。计算公式由卡方统计量修改而得,公式如下:
系数介于0和1之间,其中,K为行数和列数较小的实际数。
交叉列联表分析的具体操作步骤如下:
打开数据文件,选择【分析】(Analyze)菜单,单击【描述统计】(Descriptive
Statistics)命令下的【交叉表】(Crosstabs)命令。"交叉表"(Crosstabs)主对话框如图3-13所示。
在该主对话框中,左边的变量列表为原变量列表,通过单击
按钮可选择一个或者几个变量进入右边的"行"(Row(s))变量列表框、"列"(Column(s))变量列表框和"层"(Layer)变量列表框中。
如果是二维列联表分析,只需选择行列变量即可,但如进行三维以上的列联表分析,可以将其他变量作为控制变量选到"层"(Layer)变量列表框中。有多个层控制变量时,可以根据实际的分析要求确定它们的层次,既可以是同层次的也可以是逐层叠加的。
在"交叉表"对话框底端有两个可选择项:
显示复式条形图(Display clustered bar chart):指定绘制各个变量不同交叉取值下关于频数分布的柱形图;
取消表格(Suppress
table):不输出列联表的具体表格,而直接显示交叉列联表分析过程中的统计量,如果没有选中统计量,则不产生任何结果。所以,一般情况下,只有在分析行列变量间关系时选择此项。
该对话框的右端有4个按钮,从上到下依次为【精确】(Exact)按钮、【统计量】(Statistics)按钮、【单元格】(Cells)按钮和【格式】(Format)按钮。单击可进入对应的对话框。
单击【精确】(Exact)按钮,打开"精确检验"(Exact Tests)对话框,如图3-14所示。
该对话框提供了3种用于不同条件的检验方式来检验行列变量的相关性。用户可选择以下3种检验方式之一:
仅渐近法(Asymptotic only):适用于具有渐近分布的大样本数据,SPSS默认选择该项。
Carlo(蒙特卡罗法):此项为精确显著性水平值的无偏估计,无需数据具有渐近分布的假设,是一种非常有效的计算确切显著性水平的方法。在"置信水平"(Confidence
Level)参数框内输入数据,可以确定置信区间的大小,一般为90、95、99。在"样本数"(Number of
samples)参数框中可以输入数据的样本容量。
精确(Exact):观察结果概率,同时在下面的"每个检验的时间限制为"(Time limit per
test)的参数框内,选择进行精确检验的最大时间限度。
用户在本对话框内进行选择后,单击【继续】(Continue)按钮即可返回"交叉表"主对话框。一般情况下,"精确检验"(Exact
Tests)对话框的选项都默认为系统默认值,不作调整。
单击【统计量】(Statistics)按钮,打开"交叉表:统计量"(Crosstabs:Statistics)对话框,如图3-15所示。
在该对话框中,用户可以选择输出合适的统计检验统计量。对话框中各选项的意义如下:
(1)卡方(Chi-square)检验复选框:检验列联表行列变量的独立性检验,也被称为Pearson
chi-square检验、χ2检验。
(2)相关性(Correlations)检验复选框:输出列联表行列变量的Pearson相关系数或Spearman相关系数。
(3)名义(Nominal)栏:适用于名称变量统计量。
相依系数(Contingency coefficient):即Pearson相关系数或Spearman相关系数。
Phi 和Cramer变量(
系数):常用于名义变量之间的相关系数计算。计算公式由卡方统计量修改而得,如公式(3.13)所示。ψ系数介于0和1之间,其中,K为行数和列数较小的实际数。
Lambda(λ系数):在自变量预测中用于反映比例缩减误差,其值为1时表明自变量预测因变量好,为0时表明自变量预测因变量差。
不定性系数(Uncertainty
coefficient):以熵为标准的比例缩减误差,其值接近1时表明后一变量的信息很大程度上来自前一变量,其值接近0时表明后一变量的信息与前一变量无关。
(4)有序(Ordinal)栏:适用于有序变量的统计量。
Gamma(伽马系数,γ系数):两有序变量之间的关联性的对称检验。其数值界于0和1之间,所有观察实际数集中于左上角和右下角时,取值为1,表示两个变量之间有很强的相关;取值为0时,表示两个变量之间相互独立。
Somers'd值:两有序变量之间的关联性的检验,取值范围为[-1,1]。
tau-b值:考虑有结的秩或等级变量关联性的非参数检验,相同的观察值选入计算过程中,取值范围为[-1,1]。
tau-c值:忽略有结的秩或等级变量关联性的非参数检验,相同的观察值不选入计算过程,取值范围界为[-1,1]。
(5)按区间标定(Nominal by interval)栏:适用于一个名义变量与一个等距变量的相关性检验。
Kappa系数:检验数据内部的一致性,仅适用于具有相同分类值和相同分类数量的变量交叉表。
Eta值:其平方值可认为是因变量受不同因素影响所致方差的比例。
风险(相对危险度):检验事件发生和某因素之间的关联性。
McNemar检验:主要用于检验配对的资料率(相当于配对卡方检验)。
(6)Cochran's and
Mantel-Haenszel统计量复选框:适用于在一个二值因素变量和一个二值响应变量之间的独立性检验。
用户在"交叉表:统计量"对话框中进行选择后,单击【继续】(Continue),即可返回"交叉表"(Crosstabs)主对话框。一般情况下,对"交叉表:统计量"对话框内的选项不作选择或选择较为常用的卡方检验。
单击【单元格】(Cells)按钮,打开"交叉表:单元显示"(Crosstabs:Cell
Display)对话框,如图3-16所示。
在该对话框中,用户可以指定列联表单元格中的输出内容。SPSS17.0默认在交叉列联表中输出实际的观察值,但观察值有时候不能确切地反映事物的实质,因此还需要输出其他的数据项。对话框中各选项的具体意义如下:
(1)计数(Counts)栏:
观察值(Observed):系统默认选项,表示输出为实际观察值。
期望值(Expected):表示输出为理论值。
(2)百分比(Percentages)栏:
行(Row)百分比:以行为单元,统计行变量的百分比。
列(Column)百分比:以列为单元,统计列变量的百分比。
总计(Total)百分比:行列变量的百分比都进行输出。
(3)残差(Residuals)栏:
未标准化(Unstandardized):输出非标准化残差,为实际数与理论数的差值。
标准化(Standardized):输出标准化残差,为实际数与理论数的差值除以理论数。
调节的标准化(Adjusted standardized):输出修正标准化残差,为标准误确定的单元格残差。
(4)非整数权重(Noninteger Weights)栏:
四舍五入单元格计数(Round cell counts,系统默认):将单元格计数的非整数部分的尾数四舍五入为整数。
截短单元格计数(Truncate cell counts):将单元格计数的非整数部分的尾数舍去,直接化为整数。
四舍五入个案权重(Round case Weights):将观测量权数的非整数部分的尾数四舍五入为整数。
截短个案权重(Truncate case Weights):将观测量权数的非整数部分的尾数舍去,化为整数。
无调节(No adjustments):不对计数数据进行调整。
用户在"交叉表:单元显示"对话框中进行选择后,单击【继续】(Continue)按钮,即可返回"交叉表"主对话框。一般情况下,对"交叉表:单元显示"对话框的选项都默认为系统默认值,不作调整。
单击【格式】(Format)按钮,打开"交叉表:表格格式"(Crosstabs:Table
Format)对话框,如图3-17所示。
在该对话框中,用户可以指定列联表的输出排列顺序。对话框中各选项的具体意义如下:
在行序(Row Order)栏中有如下两个选项:
升序(Ascending):系统默认,以升序显示各变量值;
降序(Descending):以降序显示各变量值。
用户在该对话框中进行选择后,单击【继续】(Continue)按钮,即可返回"交叉表"主对话框。
在"交叉表"对话框中单击【确定】(OK)按钮,可在输出窗口中得到数据概述、交叉列联表、卡方检验表、交叉分组下频率分布柱形图、相对危险性估计等图表。
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
SAS_列联表分析Chap10_SAS_列联表分析
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口第六章作业_yfyxx吧_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0成为超级会员,使用一键签到本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:835贴子:
第六章作业收藏
第一题 条件判断:连续性变量
单样本t检验正态性检验
Kolmogorov-Smirnova Shapiro-Wilk 统计量 df Sig. 统计量 df Sig. 差值 .245 11 .063 .866 11 .069 a. Lilliefors 显著水平修正
正态性检验p=0.069&0.05,符合正态分布。假设检验
单个样本检验
检验值 = 0
t df Sig.(双侧) 均值差值 差分的 95% 置信区间 下限 上限 差值 1.064 10 .312 .33727 -.8
H0:μ= 0,用该法测CaCO3所得的均值与真值无差异。H1:μ≠0,用该法测CaCO3所得的均值与真值有差异。α=0.05计算统计量:p=0.312,按α=0.05水准不拒绝H0,根据目前资料尚不能认为用该法测CaCO3所得的均值与真值有差异。第二题条件判断:连续性变量单样本t检验(将两种方法测得值差作为一个新样本看待)正态性检验
Kolmogorov-Smirnova Shapiro-Wilk 统计量 df Sig. 统计量 df Sig. 差值 .247 10 .084 .890 10 .169 a. Lilliefors 显著水平修正
正态性检验单个样本检验
检验值 = 0
t df Sig.(双侧) 均值差值 差分的 95% 置信区间 下限 上限 差值 .796 9 .447 .09500 -.
p=0.169&0.05,符合正态分布假设检H0:μC=0,用两种方法测定碘含量的结果相同。H1:μC≠0,用两种方法测定碘含量的结果不同。α=0.05计算统计量:spss计算p=0.447,按α=0.05水准不拒绝H0,根据目前资料认为用两种方法测定碘含量的结果相同。第三题条件判断:连续性变量完全随机设计正态性检验,正态性检验
Kolmogorov-Smirnova Shapiro-Wilk 统计量 df Sig. 统计量 df Sig. 正常组 .225 12 .095 .916 12 .255 a. Lilliefors 显著水平修正
正态性检验
Kolmogorov-Smirnova Shapiro-Wilk 统计量 df Sig. 统计量 df Sig. 患者 .142 12 .200* .937 12 .461 a. Lilliefors 显著水平修正*. 这是真实显著水平的下限。
p方分别为0.255&0.05,0.461&0.05,符合正态分布。方差齐性检验p=0.338&0.05,方差齐假设检H0:μ1=μ2,正常人和牙周炎患者血清TNF-α平均含量相同。H1:μ1≠μ2,正常人和牙周炎患者血清TNF-α平均含量不同。α=0.05计算统计量:spss计算得p=0.000,按α=0.05水准拒绝H0,接受H1,根据目前资料认为正常人和牙周炎患者血清TNF-α平均含量不同,牙周炎患者血清中TNF-α含量高于正常人。第五题条件判断:连续性变量完全随机设计(将两组治疗前后血清Sli-2R水平差值作为样本资料)正态性分析正态性检验
Kolmogorov-Smirnova Shapiro-Wilk 统计量 df Sig. 统计量 df Sig. A组差值 .170 13 .200* .968 13 .864 a. Lilliefors 显著水平修正*. 这是真实显著水平的下限。
正态性检验
Kolmogorov-Smirnova Shapiro-Wilk 统计量 df Sig. 统计量 df Sig. B组差值 .199 12 .200* .904 12 .181 a. Lilliefors 显著水平修正*. 这是真实显著水平的下限。
分别为0.864&0.05,0.181&0.05,符合正态分布。方差齐性检验p=0.019&0.01,方差齐。假设检验H0:μ1=μ2,A、B两组患者血清Sil-2R水平治疗前后改变无差异。H1:μ1≠μ2,A、B两组患者血清Sil-2R水平治疗前后改变有差异。α=0.05计算统计量spss计算得p=0.000,按α=0.05水准拒绝H0,接受H1,根据目前资料认为认为A、B两组患者血清Sil-2R水平治疗前后改变有差异,B组治疗前后血清Sli-2R水平变化较大
请问这个正态性检验是看哪个p值。。。又是怎么比较的。。。谢谢
第八章第一题检验假设:H0:人工牛黄不增加该方剂的疗效H1:人工牛黄增加该方剂的疗效α=0.05F=8.899 p=0.003 p&0.05 拒绝H0结论:人工牛黄增加该方剂的疗效第二题检验假设:H0:患冠心病和未患冠心病的老人食盐超标的概率相同H1:患冠心病和未患冠心病的老人食盐超标的概率不同α=0.05F=2.015 p=0.156 p&0.05 拒绝H1结论:没有足够证据表明,患冠心病和未患冠心病的老人食盐超标的概率不同第三题检验假设:H0:三个方剂的治疗效果无差别H1:三个方剂的治疗效果有差别α=0.05F=4.36 p=0.113 p&0.05 拒绝H1结论:没有足够证据表明,三个方剂的治疗效果有差别第四题检验假设:H0:两组肝波形差异无统计学意义H1:两组肝波形差异有统计学意义α=0.05F=614.000 p=0.000 p&0.05 拒绝H0结论:两组肝波形差异有统计学意义第五题1. 条件判断:该资料属于配对2x2列联表资料检验,因为b+c=30+8&40,所以需用校正公式2.假设检验(1)建立检验假设,确定检验水准H0:π1=π2,两种简易方法对早期乳腺癌的检出概率无差别。H1:π1≠π2,两种简易方法对早期乳腺癌的检出概率有差别。α=0.05(2) 计算检验统计量 (3) 得出结论经SPSS软件进行卡方检验得到 p=0.000&α=0.05,在α=0.05检验水准上拒绝H0,接受H1,差异有统计学意义,可以认为两种简易方法对早期乳腺癌的检出概率有差别。第六题1. 条件判断:该资料属于配对3x3列联表资料检验2.假设检验(1)建立检验假设,确定检验水准H0:π1=π2,两种方法的概率分布无差别。H1:π1≠π2,两种方法的概率分布有差别。α=0.05(2) 计算检验统计量 (3) 得出结论经SPSS软件进行卡方检验得到 p=0.209&α=0.05,在α=0.05检验水准上不拒绝H0,差异无统计学意义,尚不能认为两种方法治疗结果的概率分布不相同。
基于秩次的非参数检验第6题条件判断:连续性变量,配对资料,差值不服从正态型分布(p=0.045),秩和检验。1.建立检验假设,确定检验水准H0:服药前后精液差值的总体中位数等于0H1:服药前后精液差值的总体中位数不等于0α=0.052.编秩,计算检验统计量z=-2.1003.计算p值,作出推断p=0.036,按α=0.05得水准拒绝H0,接受H1,差异有统计学意义。可以认为服用肠溶醋酸棉酚片可以使男子的精液浓度下降。第7题分别用0代表无效的疗效,1代表有效疗效,2代表治愈疗效。用秩和检验方法检验两种方法的效果是否相同。1 建立检验假设,确定检验水准H0:两种方法效果相同H1:两种方法效果不同α=0.052 计算检验统计量求秩和 A法;T=327 B法:T=201 Z=-2.5183 确定P值,作出推断P=0.012,按α=0.05水准拒绝H0,接受H1,差异有统计学意义,可以认为两种方法治疗扁平足的效果不同。中草药软膏法的总秩为327,癣敌软膏法的总秩为201,两组的n相同,可以认为中草药软膏法治疗扁平足的效果更好。第8题条件判断:连续型变量,甲水井水质氟化物含量不满足正态分布(p=0.096),乙水井水质氟化物含量满足正态分布(p=0.021),两样本量不同,采用秩次检验。1 建立检验假设,确定检验水准H0:两地水井氟化物含量的中位数相等H1,:两地水井氟化物含量的中位数不相等α=0.052 编秩,计算检验统计量甲:T=42.00,乙:T=111.00,Z=-2.0623 计算p值,作出推断p=0.039,按α=0.05水准拒绝H0,接受H1,差异有统计学意义。可以认为乙地井水氟化物含量高于甲地水井。第9题条件判断:等级资料,秩和检验。1 建立检验假设,确定检验水准H0:两种方法效果相同H1:两种方法效果不同α=0.052 计算检验统计量求秩和实验组;T=14817.50 对照组:T=3903.50Z=-10.8863 确定P值,作出推断P=0.000,按α=0.05水准拒绝H0,接受H1,差异有统计学意义,可以认为西布曲明片有减肥作用。第10题条件判断:连续性变量,A组吞噬率呈正态性分布(p=0.033),B组吞噬率呈正态性分布(p=0.037),C组吞噬率非正态分布(p=0.453)1 建立检验假设,确定检验水准H0:三组吞噬率相同H1:三组吞噬率不完全相同α=0.052 计算检验统计量求秩和 A组;T=38.67 B组:T=36.76 C组:T=8.97 χ^2=33.128,υ=23 确定P值,作出推断P=0.000,按α=0.05水准拒绝H0,接受H1,差异有统计学意义,三组吞噬率不全相同。第11题条件判断:等级资料,秩和检验。1 建立检验假设,确定检验水准H0:3种复方小叶枇杷对老年慢性支气管炎治疗效果相同H1:3种复方小叶枇杷对老年慢性支气管炎治疗效果不全相同α=0.052 计算检验统计量求秩和老复方;T=244.88 复方1:T=317.67 复方2:T=278.87, χ^2=22.246,υ=23 确定P值,作出推断P=0.000,按α=0.05水准拒绝H0,接受H1,差异有统计学意义,可以认为3种复方小叶枇杷对老年慢性支气管炎治疗效果不全相同。
第二章P31思考与练习1、(1)如图所示频率表,直方图,箱式图。分布特征:男童中等胸围者居多,越靠近两端,频数逐渐减少,在56.0(cm) 组频数最多,近似对称分布。(2)、利用原始数据描述胸围的平均水平和变异度:本例近似对称分布即:均数±标准差为55.12±2.32(cm)(3)利用频率表算的的X平均、S、P25 、P50、P75如图所示:比较X平均和P50,两者虽然不相同,但却比较接近。如果胸围的测量分布是完全对称的,那么X平均和P50就会相等。(4)利用原始数据和频率表计算相同的统计指标结果不相同,但比较接近。因为频率表法算的结果是原始数据的近似值,它概括了原始数据的信息,虽然不如原始数据精确,但在样本量很大而计算工具不可及时,仍可以通过手工计算,较为方便的得到近似统计指标。3、由于最大值不确定,所以可选用中位数和四分位间距结合来描述变量的平均水平和变异程度。M=16.5(天)P25=14.25(天)、P75=20.75(天)Q=20.75-14.25=6.5(天)(因为末端不确定值在计算上,下四分位数时已经被舍去,只留取中间的50%个体观察值,因此对计算不产生影响,所以输入时输入符合其条件的&90的任何数计算即可)3、30名麻疹易感儿童血凝抑制抗体平均滴度因此,易感儿童血凝抑制抗体平均滴度为:1:48.5。4、由于新生儿与儿童身高的差距较大,因此我们采用变异系数进行比较。新生儿:CV=×100%=×100%=3.67%儿 童:CV=×100%=×100%=2.78%说明新生儿身高的变异程度大于儿童身高的变异程度。补充:5、标准差与标准误的区别与联系区别:(1)概念不同:标准差是样本数据方差的平方根,它衡量的样本数据的离散程度;标准误是样本均值的标准差,衡量的是样本均值的离散程度。而在实际的抽样中,习惯用样本的均值来推断总体的均值,那么样本均值的离散程度(标准误)越大,抽样误差就越大,所以用标准误来衡量抽样误差的大小。(2)与样本含量的关系不同:随着样本数n的增大,标准差趋向某个稳定值,而标准误随着n的增大而减小,甚至趋于0。(3)用途不同:标准差与均数结合估计参考值范围,计算变异系数,计算标准误等,标准误用于估计参数的可信区间,进行假设检验等。联系:标准误是标准差的,二者都是衡量样本变量随机性的指标,只是从不同角度来反应误差。
第十章第1题1.检验其正态可看出碘含量P=0.429,患病率P=0.125,均&0.05,均服从正态分布。2.假设检验H0:不同地区的甲状腺肿的患病率高低与本地区水质的碘含量相互独立H1:不同地区的甲状腺肿的患病率高低与本地区水质的碘含量相互关联检验水准α=0.05可看出相关系数r=-0.645,P=0.084&0.05,接受H0,即不同地区的甲状腺肿的患病率高低与本地区水质的碘含量相互独立。第2题1.血浆清蛋白含量(x)P=0.793,血红蛋白含量(y)P=0.334,均大于0.05,均服从正态性。2.假设检验H0:成年男子的血浆清蛋白含量和血红蛋白含量相互独立H1:成年男子的血浆清蛋白含量和血红蛋白含量相互关联检验水准α=0.05可看出相关系数r=0.960,P=0.000&0.05,接受H1,即成年男子的血浆清蛋白含量和血红蛋白含量相互关联,且密切正相关。第3题等级资料。用Gamma系数检验假设检验H0:患者年龄与疗效相互独立H1:患者年龄与疗效相互关联检验水准α=0.05G=0.479,P=0.000&0.05,接受H1,即患者年龄与疗效相互关联。关联系数为0.479。第4题等级资料。用Gamma系数检验假设检验H0:早期分度与最后定型之间相互独立H1:早期分度与最后定型之间相互关联检验水准α=0.05可看出G=0.990,P=0.000&0.005,接受H1,即早期分度与最后定型之间相互关联,关联系数为0.990。第5题两有序分类变量资料,用Gamma系数检验。假设检验H0:失血量的多少与妊娠阶段之间相互独立H1:失血量的多少与妊娠阶段之间相互联系检验水准α=0.05可看出G=0.057,P=0.576&0.05,接受H0,即失血量的多少与妊娠阶段之间相互独立。第6题2*连列表的资料,用卡方检验假设检验H0:”AFP阳性“和”是否患原发性肝癌“之间相互独立H1:”AFP阳性“和”是否患原发性肝癌“之间相互关联检验水准α=0.05x2=128.501&3.84,P=0.000&0.05,G=0.975,接受H1,即”AFP阳性“和”是否患原发性肝癌“之间相互关联,关联系数为0.975。
第11章1题散点图从散点图可看出,X与Y有线性趋势。正态性检验Px=0.929,Py=0.992,均&0.05,均服从正态分布。(1)假设检验H0;X与Y无线性回归关系H1;X与Y有线性回归关系检验水准α=0.05关联系数r=0.946,P=0.00&0.05,接受H1,即X与Y有线性回归关系.关联系数为0.946。(2)假设检验H0;X与Y无线性回归关系H1;X与Y有线性回归关系检验水准α=0.05样本b=1.758,P=0.000,&0.05,接受H1,可认为X与Y有线性回归关系。其总体回归系数不为0.(3)相关系数r是表示两个随机变量之间线性相关强度和方向的统计量。正负值表示两个变量之间相关的方向。r的绝对值大小则表示两变量之间线性相关的密切程度。回归系数b线性回归模型中的斜率。反映Y与X的线性关系。此题中r=0.946,p=0.000,相关程度较大。b=1.758,p=0.000,可认为Y与X之间存在线性关系。回归系数b=1.758.(4)总体回归系数的95%置信区间为(1,268,2.247).第2题(1)散点图可看出身高与肺无效腔容积之间存在线性关系。(2)先检验其正态性。身高p=0.749,肺无效腔容积p=0.589,均大于0.05,均服从正态分布。假设检验H0:ρ=0H1:ρ≠0检验水准α=0.05相关系数r=0.857.p=0.000&0.005,相关系数为0.857,接受H1,总体相关系数不为0.(3)Y=-78.336+0.998X(4)t检验假设检验H0:β=0H1:β≠0检验水准α=0.05由上图可知t=5.997,p=0.000&.005,接受H1,即β≠0方差分析假设检验H0:β=0H1:β≠0检验水准α=0.05可看出F=35.960,p=0.000&0.05,接受H1,即β≠0。(5)根据前面所得和书上公式,可得r=0.857,tr=5.996,tb=5.997,F=35.960,√F=5.9967.即可证明tr=tb=√F(6)总体回归系数β的 95%置信区间为(0.639,1.358)(7)作残差图可看出残差图符合正态分布,满足方差齐性。 11-3(1)散点图可看出体重和臀围具有线性关系。检验变量的正态性。体重p=0.853,臀围p=0.873,均大于0.05,服从正态分布。计算相关系数。相关系数r=0.944,p=0.000&0.05,具有相关性。做线性回归方程。Y=53.102+0.648X。2)臀围总体均数的95%置信区间为(77.4)。体重为62kg的男子臀围总体均数的95%置信区间为(91.69)。臀围的95%预测区间为(87.44)。体重为88kg的男子臀围总体均数的95%置信区间为(106.196)。臀围的95%预测区间为(103.019)。11-9(1)X--Y1散点图可看出X与Y1之间具有线性关系。求线性方程。回归系数假设检验假设检验H0:X与Y1之间无线性回归关系。H1:X与Y1之间有线性回归关系。检验水准α=0.05可看出t=4.255,p=0.002&0.05,接受H1,即X与Y1之间有线性回归关系。线性回归方程为Y=3.006+0.499X。(2)X--Y2可看出X与Y2之间存在非线性关系。(3)X--Y3散点图可看出X与Y3之间存在线性关系。求线性方程。回归系数假设检验。假设检验H0:X与Y1之间无线性回归关系。H1:X与Y1之间有线性回归关系。检验水准α=0.05可看出t=4.267,p=0.002&0.05,接受H1,即X与Y1之间有线性回归关系。线性回归方程为Y=3.012=0.498X。(4)X4--Y4散点图可看出X4与Y4之间存在非线性关系。236-10散点图可看出,此地氰化物浓度与距污染源的距离之间存在线性关系。相关系数可看出,相关系数r=-0.821,p=0.013&0.05,即此地氰化物浓度与距污染源的距离之间存在负相关。求线性回归方程。回归系数假设检验。假设检验H0:此地氰化物浓度与距污染源的距离之间无线性回归关系。H1:X此地氰化物浓度与距污染源的距离之间有线性回归关系。检验水准α=0.05可看出t=-3.521,p=0.013&0.05,接受H1,即此地氰化物浓度与距污染源的距离之间有线性回归关系。线性回归方程为Y=0.506-0.001X。调整后决定系数r=0.674,即污染远距离的变化的信息大约可解释氰化物浓度信息量的67.4%。
十二章第1题以糖化血红蛋白含量为因变量(Y),年龄(X1)、体重指数(X2)、总胆 固醇(X3)、收缩压(X4)和舒张压(X5)为自变量,进行多重回归分析后,结果如 下表,并得到一般线性回归方 程:&#x-0.160X1+0.140X2+0.453X3+0.004X4+0.012X5( F =6.633, P =0.000) ,但由结 果可知,年龄、收缩压和舒张压的回归系数均无统计学意义。故采用Stepwise法筛选 自变量,得回归曲线&#x+0.153X2+0.482X3( F =15.743, P =0.000)。 (二)、 将 表 格 数 据 录 入 SPSS , 建立二元回 归 模 型 如 下 : &#x+4.095X1+8.106X2( F =, P =0.000), 回 归 系 数 t 检验得知性别 (t=12.003, P =0.000)和年龄(t=106.055, P =0.000)的回归系数均有统计学意义。(三)、经Enter法建立多重线性回归模型发现模型没有统计学意义。用Stepwise法建立模型 时,未有有统计学意义的变量被引入。
登录百度帐号推荐应用
为兴趣而生,贴吧更懂你。或

我要回帖

更多关于 线性相关系数公式 的文章

 

随机推荐