流行病学资料中的匹配资料卡方值是怎么算出来的。

查看: 421|回复: 22
几种常见的滥(乱)用卡方检验的情况
TA的每日心情开心 08:17签到天数: 36 天[LV.5]常住居民I
本帖最后由 御剑迎风 于
08:45 编辑
由于个人精力和能力有限,关于统计常见错误的讲解,就先不原创了,先进行一些转帖了。
感谢大家长时间的关注!
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
卡方检验是医学科研中最常用的统计学方法之一,主要用于对分类资料进行比较分析。笔者粗略估计,医学期刊上刊登的临床研究类论文中,70% 以上会使用该统计方法对数据进行分析。然而,在医学期刊,特别是国内期刊上刊登的论文中,滥(乱)用卡方检验的情况十分普遍、屡见不鲜。
在此,笔者拟就常见的滥(乱)用卡方检验的情况进行总结、概括和辨析,以帮助大家正确使用卡方检验。
1、忽略卡方检验的应用条件
【原文1】佝偻病组与对照组的 VDR基因型分布频率见表1。
表1. 两组VDR基因型分布频率
& & & & & & & & & & & & & & & &
(《中华儿科杂志》2005年发表)
【分析1】R×C资料χ2检验要求理论频数(注意不是实际频数)不宜太小,即有1/5以上格子的理论频数小于5,或有1个格子的理论频数小于1。如果遇到上述情况,有四种处理方法:
① 增大样本量;② 采用Fisher确切概率法;③ 将理论频数太小的行或列与性质相近的邻行或邻列合并;④ 删去理论频数太小的格子所对应的的行或列。
在该例中,有2个格子的理论值小于5,因此采用Fisher确切概率法,计算得到χ2=0.269,P=0.943,差异无统计学意义,不能认为两组的VDR基因型分布有差异。
【原文2】经查体甲状腺、心、肺、肝、脾阳性体征发生率,两组差异无显著性(P&0.05),见表2。
表2. 医用X线组与对照组阳性体征比较
& & & & & & & & & & & & & & & &
(《预防医学文献信息》1997年发表)
【分析2】四格表χ2检验的应用条件为:
① 若n≥40且T&5时,用四格表χ2检验;② 若n≥40且1≤T≤5时,用校正四格表χ2检验;③ 若n&40或T&1时,用Fisher确切概率法。其中n为样本量,T为每个格子的理论频数(注意不是实际频数)。
在该例中,根据上述应用条件,甲状腺肿大、肺部异常、脾肿大三项应该采用Fisher 确切概率法,计算得三项均P&0.999,心脏异常、肝肿大两项应该采用校正四格表χ2检验,计算得两项χ2&0.001,P&0.999。
2、不能正确运用卡方检验分析有序资料
【原文1】从表3看,治疗组总有效率高于对照组,差异有统计学意义(χ2=3.906,P&0.05)。
表3. 治疗组与对照组疗效比较 (例(%))
& & & & & & & & & & & & & & & &
(《针灸临床杂志》2010年发表)
【分析1】该研究实际上是将表3中的治愈、显效、有效三列数据合并为“有效”一列,然后与“无效”构成四格表的形式进行了四格表的χ2检验,读取了pearson卡方值,此时方法应用的本身并无错误,但是合并之后忽略了疗效的“等级”信息,相当于把信息粗化了。
该资料为单向有序资料,可以选择χ2检验的方法进行分析,但应读取linear-by-linear association的结果,即linear-by-linear association统计量为6.182,P&0.001,认为治疗组和对照组的疗效总体分布不同。
表4. 不同年龄组超重与肥胖的分布情况
& & & & & & & & & & & & & & & &
(《湘南学院学报》2004年发表)
【分析2】对于双向有序且属性不同的资料(以表4为例):
① 若研究目的是了解不同年龄组的BMI分布情况,可使用χ2检验,读取linear-by-linear association的结果;
② 若研究目的是了解年龄与BMI之间的相关关系,使用等级相关分析;
③ 若研究目的是想了解是否随着年龄的增长,BMI呈上升趋势,则可以采用χ2检验中ordinal中的gamma方法。
本研究是想了解年龄与BMI之间的关系,故应该采用等级相关分析,原文使用χ2检验方法是不对的。Spearman秩相关分析结果为:相关系数0.293,P&0.001,总体相关系数具有统计学意义。
3、误用一般卡方检验分析配对资料
【原文】用念珠菌显色培养基和沙保培养基,对3种念珠菌同时平行接种进行生长试验比较。结果经χ2检验,沙保培养基对白色念珠菌和热带念珠菌差异有显著意义P&0.01和P&0.05,而克柔念珠菌对这两种培养基差异无显著意义P&0.5,结果见表5。
表5. 两种培养基对126株念珠菌在48h生长情况(株)比较
& & & & & & & & & & & & & & & &
(《中华医学检验杂志》1999年发表)
【分析】该研究为配对设计,应该采用配对四格表的χ2检验。因为独立样本四格表资料,研究对象是随机分配的,不同组的数据相互独立;而配对四格表资料中,研究对象事先以某种方式配对,然后再根据不同组进行统计,结果不是相互独立的。
配对四格表χ2检验的应用条件为:① 若b+c≥40,应用配对四格表χ2检验计算公式;② 若b+c&40,需作连续性校正。
根据上述应用条件重新计算,得到三组χ2值和P值分别为χ2 1=21.43,P1&0.01;χ2 2=10.32,P2&0.01;χ2 3=5.33,P3&0.05;三组差异均有统计学意义。此外该研究还存在明显的错误,即原文描述与表格中的数据并不相符。
本文初步分析了几种常见的滥(乱)用卡方检验的情况,限于篇幅以及笔者水平所限,一些较为复杂的、少见的滥(乱)用卡方检验的行为不再一一赘述。实际上,在统计学家眼里,本文的观点多已是很基础的、老生常谈的话题,甚至并无成文的价值。之所以将这些问题重新总结成文,只是有感于部分同行在分析数据时不分青红皂白地滥(乱)用卡方检验处理数据,得出一番令人啼笑皆非的统计学结果之后还全然不知。希望读者阅毕本文后,在一笑而过的同时,能若有所思。
上一篇:下一篇:
TA的每日心情开心 08:04签到天数: 90 天[LV.6]常住居民II
第一个例子的问题主要是在样本量太小么?我的毕业课题貌似也是这么分组做的,不过我的样本量比较大。。。。
TA的每日心情奋斗 08:09签到天数: 61 天[LV.6]常住居民II
写论文的必看。卡方检验不能乱用的。
TA的每日心情开心 08:17签到天数: 36 天[LV.5]常住居民I
第一个例子的问题主要是在样本量太小么?我的毕业课题貌似也是这么分组做的,不过我的样本量比较大。。。。
这个是AA样本例数太少,没有超过5~
与你分组无关
TA的每日心情开心 19:03签到天数: 69 天[LV.6]常住居民II
谢谢老师的资料分享,学习了。
TA的每日心情开心 10:10签到天数: 101 天[LV.6]常住居民II
史老师是统计大家~
TA的每日心情奋斗 08:14签到天数: 1 天[LV.1]初来乍到
老师你好!为什么我的Fisher确切概率法结果没有检测值,只有一个p值,spss上操作的。
TA的每日心情开心 08:00签到天数: 88 天[LV.6]常住居民II
第一个例子的问题主要是在样本量太小么?我的毕业课题貌似也是这么分组做的,不过我的样本量比较大。。。。
主要是因为其中最小理论频数Tmin<5,跟你的分组没有关系,卡方检验的条件主要分三种:
①当n≥40且Tmin≥5时,使用一般公式;
②当n≥40且1&Tmin&5时, 使用校正公式;
③当n&40或Tmin≤1时,使用费舍尔确切概率法。
TA的每日心情开心 08:17签到天数: 36 天[LV.5]常住居民I
老师你好!为什么我的Fisher确切概率法结果没有检测值,只有一个p值,spss上操作的。
Fisher's精确检验是直接概率法,直接得到P值。无检验统计量值
TA的每日心情开心 08:17签到天数: 36 天[LV.5]常住居民I
史老师是统计大家~
过奖了,我也是借着这些案例来学习和补充自己的统计知识
在学习过程中发现这些例子很有启发意义,所以转发给大家~
TA的每日心情开心 08:00签到天数: 88 天[LV.6]常住居民II
老师你好!为什么我的Fisher确切概率法结果没有检测值,只有一个p值,spss上操作的。
费舍尔确切概率法本身就是没有检验统计量的,是直接给计算出结果发生的精确概率,拿来直接跟设定的α值相比较即可
TA的每日心情开心 08:00签到天数: 88 天[LV.6]常住居民II
Fisher's精确检验是直接概率法,直接得到P值。无检验统计量值
跟史老师竟然同时回复了,向史老师学习
TA的每日心情开心 08:17签到天数: 36 天[LV.5]常住居民I
跟史老师竟然同时回复了,向史老师学习
您老谦虚了
这么详细而明了的解释,应该是我向你学习
TA的每日心情开心 10:46签到天数: 64 天[LV.6]常住居民II
这个东西不太懂,好像又先天的免疫力,虽然认真学习了,但还是半懂半不懂。
TA的每日心情奋斗 12:16签到天数: 102 天[LV.6]常住居民II
这些问题主要是忽视卡方检验的应用条件,如果知道应用条件,就不会犯这些错误& && &
TA的每日心情奋斗 08:14签到天数: 80 天[LV.6]常住居民II
学习了,谢谢分享!以后有不会的终于找到老师可以询问了
TA的每日心情奋斗 08:14签到天数: 1 天[LV.1]初来乍到
Fisher's精确检验是直接概率法,直接得到P值。无检验统计量值
谢谢老师的解答,但是我看老师您案例分析1第5行Fisher确切概率法给出了一个χ2=0.269,P=0.943,这个卡方值又是从哪里得出的呢,我在投文章的时候需要写上去吗?而且我看有些Fisher确切概率法监测结果又有检测值,希望老师能赐教,谢谢!C:\Documents and Settings\Administrator\桌面
TA的每日心情开心 08:17签到天数: 36 天[LV.5]常住居民I
谢谢老师的解答,但是我看老师您案例分析1第5行Fisher确切概率法给出了一个χ2=0.269,P=0.943,这个卡方 ...
1.卡方和Fisher精确精确检验都适应用于四格表,只不过适应条件不同(见8楼老师回复)
2.至于是采用卡方检验结果还是Fisher精确检验结果,需要见表下面的a解释,如本次说2个单元格期望值少于5,那么应该采用Fisher精确检验。
3.SPSS在四格表时是真正的Fisher精确概率法。在行数或列数大于2时,用的是模拟法,而非真正的Fisher精确概率法,故出现统计量值。
TA的每日心情奋斗 08:14签到天数: 1 天[LV.1]初来乍到
1.卡方和Fisher精确精确检验都适应用于四格表,只不过适应条件不同(见8楼老师回复)
2.至于是采用卡方 ...
非常感谢老师的解答!
TA的每日心情奋斗 08:13签到天数: 107 天[LV.6]常住居民II
这方面的知识欠缺,学习并收藏慢慢消化!
Powered by您现在的位置:&&>&&>&&>&&>&正文
医学统计之星
在很久很久以前,地球上还是一个阴森恐怖的黑暗时代,大地上恐龙横行,我们的老祖先--类人猿惊恐的睁大了双眼,围坐在仅剩的火堆旁,担心着无边的黑暗中不知何时会出现的妖魔鬼怪,没有电视可看,没有网可上...
我是疯了,还是在说梦话?都不是,类人猿自然不会有机会和恐龙同时代,只不过是我开机准备写这一部分的时候,心里忽然想到,在10年前,国内的统计学应用上还是卡方检验横行,分层的M-H卡方简直就是超级武器,在流行病学中称王称霸,更有那些1:M的配对卡方,N:M的配对卡方,含失访数据的N:M配对卡方之类的,简直象恐龙一般,搞得我头都大了。其实恐龙我还能讲出十多种来,可上面这些东西我现在还没彻底弄明白,好在社会进步迅速,没等这些恐龙完全统制地球,Logistic模型就已经飞速进化到了现代人的阶段,各种各样的Logistic模型不断地在蚕食着恐龙爷爷们的领地,也许还象贪吃的人类一样贪婪的享用着恐龙的身体。好,这是好事,这里不能讲动物保护,现在我们就远离那些恐龙,来看看现代白领的生活方式。
特别声明:我上面的话并非有贬低流行病学的意思,实际上我一直都在做流行病学,我这样写只是想说明近些年来统计方法的普及速度之快而已。
据我一位学数学的师兄讲,Logistic模型和卡方在原理上是不一样的,在公式推演上也不可能划等号,只是一般来说两者的检验结果会非常接近而已,多数情况下可忽略其不同。
§10.3 Binary Logistic过程
所谓Logistic模型,或者说Logistic回归模型,就是人们想为两分类的应变量作一个回归方程出来,可概率的取值在0~1之间,回归方程的应变量取值可是在实数集中,直接做会出现0~1范围之外的不可能结果,因此就有人耍小聪明,将率做了一个Logit变换,这样取值区间就变成了整个实数集,作出来的结果就不会有问题了,从而该方法就被叫做了Logistic回归。
随着模型的发展,Logistic家族也变得人丁兴旺起来,除了最早的两分类Logistic外,还有配对Logistic模型,多分类Logistic模型、随机效应的Logistic模型等。由于SPSS的能力所限,对话框只能完成其中的两分类和多分类模型,下面我们就介绍一下最重要和最基本的两分类模型。
<FONT color=#.3.1 界面详解与实例
例11.1 某研究人员在探讨肾细胞癌转移的有关临床病理因素研究中,收集了一批行根治性肾切除术患者的肾癌标本资料,现从中抽取26例资料作为示例进行logistic回归分析(本例来自《卫生统计学》第四版第11章)。
i: 标本序号
x1:确诊时患者的年龄(岁)
x2:肾细胞癌血管内皮生长因子(VEGF),其阳性表述由低到高共3个等级&
x3:肾细胞癌组织内微血管数(MVC)&
x4:肾癌细胞核组织学分级,由低到高共4级&
x5:肾细胞癌分期,由低到高共4期&
y: 肾细胞癌转移情况(有转移y=1; 无转移y=0)。
在菜单上选择Analyze==》Regression==》Binary Logistic...,系统弹出Logistic回归对话框如下:
左侧是候选变量框,右上角是应变量框,选入二分类的应变量,下方的Covariates框是用于选入自变量的,只不过这里按国外的习惯被称为了协变量。两框中间的是BLOCK系列按扭,我在上一课已经讲过了,不再重复。中下部的&a*b&框是用于选入交互作用的,和其他的对话框不太相同(我也不知道为什么SPSS偏在这里做得不同),下方的Method列表框用于选择变量进入方法,有进入法、前进法和后退法三大类,三类之下又有细分。最下面的四个按钮比较重要,请大家听我慢慢道来:
Select&&钮:用于限定一个筛选条件,只有满足该条件的记录才会被纳入分析,单击它后对话框会展开让你填入相应的条件。不过我觉得该功能纯属多余,和专门的Select对话框的功能重复了。
Categorical钮:如果你的自变量是多分类的(如血型等),你必须要将它用哑变量的方式来分析,那么就要用该按钮将该变量指定为分类变量,如果有必要,可用里面的选择按钮进行详细的定义,如以哪个取值作为基础水平,各水平间比较的方法是什么等。当然,如果你弄不明白,不改也可以,默认的是以最大取值为基础水平,用Deviance做比较。
Save钮:将中间结果存储起来供以后分析,共有预测值、影响强度因子和残差三大类。
Options钮:这一部分非常重要,但又常常被忽视,在这里我们可以对模型作精确定义,还可以选择模型预测情况的描述方式,如Statistics and Plots中的Classification plots就是非常重要的模型预测工具,Correlations of estimates则是重要的模型诊断工具,Iteration history可以看到迭代的具体情况,从而得知你的模型是否在迭代时存在病态,下方则可以确定进入和排除的概率标准,这在逐步回归中是非常有用的。
好,根据我们的目的,应变量为Y,而X1~X5为自变量,具体的分析操作如下:
Analyze==》Regression==》Binary Logistic...
Dependent框:选入Y
Covariates框:选入x1~x5
OK钮:单击
<FONT color=#.3.2 结果解释
Logistic Regression
上表为记录处理情况汇总,即有多少例记录被纳入了下面的分析,可见此处因不存在缺失值,26条记录均纳入了分析。
上表为应变量分类情况列表,没什么好解释的。
Block 0: Beginning Block
此处已经开始了拟合,Block 0拟合的是只有常数的无效模型,上表为分类预测表,可见在17例观察值为0的记录中,共有17例被预测为0,9例1也都被预测为0,总预测准确率为65.4%,这是不纳入任何解释变量时的预测准确率,相当于比较基线。
上表为Block 0时的变量系数,可见常数的系数值为-0.636。
上表为在Block 0处尚未纳入分析方程的侯选变量,所作的检验表示如果分别将他们纳入方程,则方程的改变是否会有显著意义(根据所用统计量的不同,可能是拟合优度,Deviance值等)。可见如果将X2系列的哑变量纳入方程,则方程的改变是有显著意义的,X4和X5也是如此,由于Stepwise方法是一个一个的进入变量,下一步将会先纳入P值最小的变量X2,然后再重新计算该表,再做选择。
Block 1: Method = Forward Stepwise (Conditional)
此处开始了Block 1的拟合,根据我们的设定,采用的方法为Forward(我们只设定了一个Block,所以后面不会再有Block 2了)。上表为全局检验,对每一步都作了Step、Block和Model的检验,可见6个检验都是有意义的。
此处为模型概况汇总,可见从STEP1到STEP2,DEVINCE从18降到11,两种决定系数也都有上升。
此处为每一步的预测情况汇总,可见准确率由Block 0的65%上升到了84%,最后达到96%,效果不错,最终只出现了一例错判。
上表为方程中变量检验情况列表,分别给出了Step 1和Step 2的拟合情况。注意X4的P值略大于0.05,但仍然是可以接受的,因为这里用到的是排除标准(默认为0.1),该变量可以留在方程中。以Step 2中的X2为例,可见其系数为2.413,OR值为11。
上表为假设将这些变量单独移出方程,则方程的改变有无统计学意义,可见都是有统计学意义的,因此他们应当保留在方程中。
最后这个表格说明的是在每一步中,尚未进入方程的变量如果再进入现有方程,则方程的改变有无统计学意义。可见在Step 1时,X4还应该引入,而在Step 2时,其它变量是否引入都无关了。
<FONT color=#.3.3 模型的进一步优化与简单诊断
10.3.3.1 模型的进一步优化
前面我们将X1~X5直接引入了方程,实际上,其中X2、X4、X5这三个自变量为多分类变量,我们并无证据认为它们之间个各等级的OR值是成倍上升的,严格来说,这里应当采用哑变量来分析,即需要用Categorical钮将他们定义为分类变量。但本次分析不能这样做,原因是这里总例数只有26例,如果引入哑变量模型会使得每个等级的记录数非常少,从而分析结果将极为奇怪,无法正常解释,但为了说明哑变量模型的用法,下面我将演示它是如何做的,毕竟不是每个例子都只有26例。
默认情况下定义分类变量非常容易,做到如上图所示就可以了,此时分析结果中的改变如下:
上表为自变量中多分类变量的哑变量取值情况代码表。左侧为原变量名及取值,右侧为相应的哑变量名及编码情况:以X5为例,表中可见X5=4时,即取值最高的情况被作为了基线水平,这是多分类变量生成哑变量的默认情况。而X5(1)代表的是X5=1的情况(X5为1时取1,否则取0),X5(2)代表的是X5=2的情况,依此类推。同时注意到许多等级值有几个记录,显然后面的分析结果不会太好。
相应的,分析结果中也以哑变量在进行分析,如下所示:
上表出现了非常有趣的现象:所有的检验P值均远远大于0.05,但是所有的变量均没有被移出方程,这是怎么回事?再看看下面的这个表格吧。
这个表格为方程的似然值改变情况的检验,可见在最后Step 2生成的方程中,无论移出X2还是X4都会引起方程的显著性改变。也就是说,似然比检验的结果和上面的Walds检验结果冲突,以谁为准?此处应以似然比检验为准,因为它是全局性的检验,且Walds检验本身就不太准,这一点大家记住就行了,实在要弄明白请去查阅相关文献。
请注意:上面的哑变量均是以最高水平为基线水平,这不符合我们的目的,我们希望将最低水平作为基线水平。比如以肾细胞癌第一期为基线水平,需要这样做只要在Categoriacl框中选中相应的变量,在Reference Category处选择First,再单击Change即可,此时变量旁的标示会做出相应的改变如下:
分析结果中也会做出相应的改变,此处略。
10.3.3.2 模型的简单诊断
SPSS本身提供了几种用于模型诊断的工具,基本上都集中在Options对话框中,除了大家熟悉的残差分析外,这里这种介绍三种简单而有非常有用的工具:迭代记录、相关矩阵和分类图。
上表为Block 1的迭代记录,可见无论是似然值,还是三个系数值,均是从迭代开始就向着一个方向发展,最终达到收敛,这说明整个迭代过程是健康的,问题不大;如果中途出现波折,尤其是当引入新变量后变化方向改变了,则提示要好好研究。
上表为方程中变量的相关矩阵,可见X2和常数相关性较强,当引入X4后仍然如此,提示要关注这一现象,以防因自变量间的共线性导致方程系数不稳(此时迭代记录多半也会有波动)。当然,由于本例只有26条记录,这一问题是没有办法深入研究的。
上图是Step 1结束时,即只引入X2时的预测图,0和1代表实际取值,当预测的概率值大于0.5时,则预测结果为1,反之为0,由上图可见,该模型对0的预测是比较好的,多数的概率都在0附近,但对1的预测不准,即使正确的,计算出的概率也在0.8左右,并且有好几个都判错了。
上图为Step 2结束后模型的预测状况,可见此时预测结果有了较大的改善,概率精度提高了许多,只有一例0被错判为了1,并且从分布上看,这一例可能是极端情况,再引入其它变量也不见的能将预测效果改变多少。
众说风云 (已有2条评论)
* 游客填写 & &* 用户名
上海、北京及广州生物技术相关行业最新的职位信息,尽在生物招聘。
成功的秘诀
关注2009――危机下的就业形势
Eppendorf 荧光定量 PCR仪
ABI Stepone TM 实时定量PCR仪,最新的软件系统,界面友好,操作简单
各种厂家和各种规格的PCR产物纯化试剂盒
最全的定量PCR试剂
从引物设计到实验全程服务全站分类导航
|||||||||||||||
|||||||||||||||
版权所有& CopyRight , MED126.COM, All Rights Reserved以下试题来自:
问答题简述病例对照研究中1:1匹配资料的分析步骤。 病例对照研究中1:1匹配资料的分析步骤包括:(1)将研究资料整理成下列四格表形式。1:1配对的病例对照资料</......
为您推荐的考试题库
你可能感兴趣的试题
OR=2.06。胚胎期暴露于X线儿童患癌的危险是胚胎期未暴露于X线儿童患癌危险的2.06倍。
病例对照研究中病例和对照的来源及其匹配:
3.问答题 (1)研究设计阶段:做好研究对象的选择,保证研究对象的代表性和可比性。(2)实施阶段:在调查实施过程中,对病例和对照的观...... 4.问答题 不匹配不分层资料的分析步骤包括:(1)将研究资料整理成下列四格表形式。 病例对照研究资料。(2)应用卡方检验分析病...... 5.问答题 优点:(1)简便、快速、省费用,因此尤其适于潜伏期长的疾病的研究。(2)尤其适于罕见病的研究。(3)可以同时研......
热门相关试卷
最新相关试卷流行病学与统计_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
流行病学与统计
阅读已结束,下载本文需要
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,方便使用
还剩10页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢

我要回帖

更多关于 脑卒中流行病学 的文章

 

随机推荐