流行病学资料中的匹配资料卡方值是怎么算出来的。

羽毛球技术 | 体育赛事 | 英文歌曲 | 住宅风水 | 用户界面设计师 | 六爻 | 书籍改编电影 | 德国足球甲级联赛 | 欧美明星 | PLC | 中国足球 | aj1 | 国家队 | 拜仁慕尼黑足球俱乐部 | 小说创作 | 配音 | iOS应用 | NBA 2K | 古典音乐 | 面相 | 火影忍者 | 武汉大学 | 土拨鼠 | 营销策划 | 秦时明月之天行九歌 | 设计师 | 巴塞罗那足球俱乐部 | 尤文图斯 | 实况足球（游戏） | 少帅 | 罗玉凤 | 比利时 | 跑鞋 | 冷知识 | 肖战 | 李元胜 | 古琴 | 按键精灵 | 罗兰 | 徐波 | 激光手术 | 角色扮演 | 关晓彤 | 微电影 | safari | 北京国安 | 古汉语 | 曼彻斯特联 | 玄幻小说 | 科幻小说 | 双眼皮手术 | 主题曲 | 年会 | 检测仪 | 徒步 | 互联网公司 | 百度输入法 | 镜头 | 宜昌市 | 自拍 | 金蝶 | 电子烟 | 网站建设 | 广播体操 | 文身 | nba篮球 | 索尼(sony) | 天体物理学 | 痛风 | 象棋 | 牛皮癣 | 皮肤护理 | 周星驰（人物） | 试管婴儿 | 亚足联亚洲杯（AFC Asian Cup） | 健美 | 美术生 | 迅雷（软件） | 战斗机 | 穿越小说 | 张璐 | 姓氏 | 诸葛亮 | 后宫·甄嬛传（书籍） | 虎牙直播 | snh48 | 阿迪达斯 | 投影仪 | 组装机 | 微信群 | 阿迪达斯(adidas) | 网球王子 | 分子生物学 | 耽美 | 武磊 | 婚礼 | 表演 | 中国武术 | 动画电影 | Air Jordan | 张子枫 | 免费软件 | 相声演员 | 摩羯座 | 宿舍 | ansys | 法国足球甲级联赛 | 户外 | 剧场版 | 杨凡 | 科幻电影 | galgame | 融资 | 关节炎 | NBA季后赛 | 神话 | 王力宏（人物） | 建模 | 计算机病毒 | 广州恒大淘宝足球俱乐部 | 北京奥运会 | 电脑电源 | 百度翻译 | 字幕 | 讯飞输入法 | 海关 | 易烊千玺 | 深度学习 | 编辑器 | 澳门特别行政区 | 直播 | 流氓软件 | 事故 | 大片 | 李景亮 | 郭富城 | 日语歌曲 | 卡牌游戏 | 小品 | 东京 | 花卉 | 音乐剧 | 互联网创业 | 占卜 | 羽毛球拍 | 婆媳关系 | 日本动画 | 巴黎 | 拳击比赛 | 东南亚 | 足球经理（FM）（游戏） | youtube | 胡歌（演员） | 地铁跑酷 | 植发 | 张继科 | 三国 | 用户界面 | 演技 | 百度竞价 | 青梅竹马 | 移动硬盘 | 韩晓鹏 | 马龙 | 瘦腿 | 宠物医疗 | 巨蟹座 | 徐峥 | 天蝎座 | 胸肌 | 赵丽颖（演员） | adidas阿迪达斯 | 低音炮 | 星际争霸（游戏） | 豆瓣电影 | 微信开放平台 | 手绘 | 吉他学习 | 江苏卫视 | 模特 | 创意 | 团队管理 | 奢侈品 | 王源 | TANK | 笛子 | 偶像 | 莱斯特城 | 维生素 | 新百伦 | 国际物流 | 前女友 | 李小龙 | 华语流行音乐 | 猎头公司 | crm | 搏击项目 | 网站运营 | 鼻炎 | 篮球游戏 |

你的位置：网站首页 >> 频道首页 >>理工学科 >>流行病学资料中的匹配资料卡方值是怎么算出来的。

流行病学资料中的匹配资料卡方值是怎么算出来的。

来源：蜘蛛抓取(WebSpider) 时间：2018-02-08 15:30 标签：脑卒中流行病学

查看: 421|回复: 22
几种常见的滥（乱）用卡方检验的情况
TA的每日心情开心 08:17签到天数: 36 天[LV.5]常住居民I
本帖最后由御剑迎风于
08:45 编辑
由于个人精力和能力有限，关于统计常见错误的讲解，就先不原创了，先进行一些转帖了。
感谢大家长时间的关注!
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
卡方检验是医学科研中最常用的统计学方法之一，主要用于对分类资料进行比较分析。笔者粗略估计，医学期刊上刊登的临床研究类论文中，70% 以上会使用该统计方法对数据进行分析。然而，在医学期刊，特别是国内期刊上刊登的论文中，滥（乱）用卡方检验的情况十分普遍、屡见不鲜。
在此，笔者拟就常见的滥（乱）用卡方检验的情况进行总结、概括和辨析，以帮助大家正确使用卡方检验。
1、忽略卡方检验的应用条件
【原文1】佝偻病组与对照组的 VDR基因型分布频率见表1。
表1. 两组VDR基因型分布频率
& & & & & & & & & & & & & & & &
（《中华儿科杂志》2005年发表）
【分析1】R×C资料χ2检验要求理论频数（注意不是实际频数）不宜太小，即有1/5以上格子的理论频数小于5，或有1个格子的理论频数小于1。如果遇到上述情况，有四种处理方法：
① 增大样本量；② 采用Fisher确切概率法；③ 将理论频数太小的行或列与性质相近的邻行或邻列合并；④ 删去理论频数太小的格子所对应的的行或列。
在该例中，有2个格子的理论值小于5，因此采用Fisher确切概率法，计算得到χ2=0.269，P=0.943，差异无统计学意义，不能认为两组的VDR基因型分布有差异。
【原文2】经查体甲状腺、心、肺、肝、脾阳性体征发生率，两组差异无显著性（P&0.05），见表2。
表2. 医用X线组与对照组阳性体征比较
& & & & & & & & & & & & & & & &
（《预防医学文献信息》1997年发表）
【分析2】四格表χ2检验的应用条件为：
① 若n≥40且T&5时，用四格表χ2检验；② 若n≥40且1≤T≤5时，用校正四格表χ2检验；③ 若n&40或T&1时，用Fisher确切概率法。其中n为样本量，T为每个格子的理论频数（注意不是实际频数）。
在该例中，根据上述应用条件，甲状腺肿大、肺部异常、脾肿大三项应该采用Fisher 确切概率法，计算得三项均P&0.999，心脏异常、肝肿大两项应该采用校正四格表χ2检验，计算得两项χ2&0.001，P&0.999。
2、不能正确运用卡方检验分析有序资料
【原文1】从表3看，治疗组总有效率高于对照组，差异有统计学意义（χ2=3.906，P&0.05）。
表3. 治疗组与对照组疗效比较（例(%)）
& & & & & & & & & & & & & & & &
（《针灸临床杂志》2010年发表）
【分析1】该研究实际上是将表3中的治愈、显效、有效三列数据合并为“有效”一列，然后与“无效”构成四格表的形式进行了四格表的χ2检验，读取了pearson卡方值，此时方法应用的本身并无错误，但是合并之后忽略了疗效的“等级”信息，相当于把信息粗化了。
该资料为单向有序资料，可以选择χ2检验的方法进行分析，但应读取linear-by-linear association的结果，即linear-by-linear association统计量为6.182，P&0.001，认为治疗组和对照组的疗效总体分布不同。
表4. 不同年龄组超重与肥胖的分布情况
& & & & & & & & & & & & & & & &
（《湘南学院学报》2004年发表）
【分析2】对于双向有序且属性不同的资料（以表4为例）：
① 若研究目的是了解不同年龄组的BMI分布情况，可使用χ2检验，读取linear-by-linear association的结果；
② 若研究目的是了解年龄与BMI之间的相关关系，使用等级相关分析；
③ 若研究目的是想了解是否随着年龄的增长，BMI呈上升趋势，则可以采用χ2检验中ordinal中的gamma方法。
本研究是想了解年龄与BMI之间的关系，故应该采用等级相关分析，原文使用χ2检验方法是不对的。Spearman秩相关分析结果为：相关系数0.293，P&0.001，总体相关系数具有统计学意义。
3、误用一般卡方检验分析配对资料
【原文】用念珠菌显色培养基和沙保培养基，对3种念珠菌同时平行接种进行生长试验比较。结果经χ2检验，沙保培养基对白色念珠菌和热带念珠菌差异有显著意义P&0.01和P&0.05，而克柔念珠菌对这两种培养基差异无显著意义P&0.5，结果见表5。
表5. 两种培养基对126株念珠菌在48h生长情况（株）比较
& & & & & & & & & & & & & & & &
（《中华医学检验杂志》1999年发表）
【分析】该研究为配对设计，应该采用配对四格表的χ2检验。因为独立样本四格表资料，研究对象是随机分配的，不同组的数据相互独立；而配对四格表资料中，研究对象事先以某种方式配对，然后再根据不同组进行统计，结果不是相互独立的。
配对四格表χ2检验的应用条件为：① 若b+c≥40，应用配对四格表χ2检验计算公式；② 若b+c&40，需作连续性校正。
根据上述应用条件重新计算，得到三组χ2值和P值分别为χ2 1=21.43，P1&0.01；χ2 2=10.32，P2&0.01；χ2 3=5.33，P3&0.05；三组差异均有统计学意义。此外该研究还存在明显的错误，即原文描述与表格中的数据并不相符。
本文初步分析了几种常见的滥（乱）用卡方检验的情况，限于篇幅以及笔者水平所限，一些较为复杂的、少见的滥（乱）用卡方检验的行为不再一一赘述。实际上，在统计学家眼里，本文的观点多已是很基础的、老生常谈的话题，甚至并无成文的价值。之所以将这些问题重新总结成文，只是有感于部分同行在分析数据时不分青红皂白地滥（乱）用卡方检验处理数据，得出一番令人啼笑皆非的统计学结果之后还全然不知。希望读者阅毕本文后，在一笑而过的同时，能若有所思。
上一篇:下一篇:
TA的每日心情开心 08:04签到天数: 90 天[LV.6]常住居民II
第一个例子的问题主要是在样本量太小么？我的毕业课题貌似也是这么分组做的，不过我的样本量比较大。。。。
TA的每日心情奋斗 08:09签到天数: 61 天[LV.6]常住居民II
写论文的必看。卡方检验不能乱用的。
TA的每日心情开心 08:17签到天数: 36 天[LV.5]常住居民I
第一个例子的问题主要是在样本量太小么？我的毕业课题貌似也是这么分组做的，不过我的样本量比较大。。。。
这个是AA样本例数太少，没有超过5~
与你分组无关
TA的每日心情开心 19:03签到天数: 69 天[LV.6]常住居民II
谢谢老师的资料分享，学习了。
TA的每日心情开心 10:10签到天数: 101 天[LV.6]常住居民II
史老师是统计大家~
TA的每日心情奋斗 08:14签到天数: 1 天[LV.1]初来乍到
老师你好！为什么我的Fisher确切概率法结果没有检测值，只有一个p值，spss上操作的。
TA的每日心情开心 08:00签到天数: 88 天[LV.6]常住居民II
第一个例子的问题主要是在样本量太小么？我的毕业课题貌似也是这么分组做的，不过我的样本量比较大。。。。
主要是因为其中最小理论频数Tmin＜5，跟你的分组没有关系，卡方检验的条件主要分三种：
①当n≥40且Tmin≥5时，使用一般公式；
②当n≥40且1&Tmin&5时，使用校正公式；
③当n&40或Tmin≤1时，使用费舍尔确切概率法。
TA的每日心情开心 08:17签到天数: 36 天[LV.5]常住居民I
老师你好！为什么我的Fisher确切概率法结果没有检测值，只有一个p值，spss上操作的。
Fisher's精确检验是直接概率法，直接得到P值。无检验统计量值
TA的每日心情开心 08:17签到天数: 36 天[LV.5]常住居民I
史老师是统计大家~
过奖了，我也是借着这些案例来学习和补充自己的统计知识
在学习过程中发现这些例子很有启发意义，所以转发给大家~
TA的每日心情开心 08:00签到天数: 88 天[LV.6]常住居民II
老师你好！为什么我的Fisher确切概率法结果没有检测值，只有一个p值，spss上操作的。
费舍尔确切概率法本身就是没有检验统计量的，是直接给计算出结果发生的精确概率，拿来直接跟设定的α值相比较即可
TA的每日心情开心 08:00签到天数: 88 天[LV.6]常住居民II
Fisher's精确检验是直接概率法，直接得到P值。无检验统计量值
跟史老师竟然同时回复了，向史老师学习
TA的每日心情开心 08:17签到天数: 36 天[LV.5]常住居民I
跟史老师竟然同时回复了，向史老师学习
您老谦虚了
这么详细而明了的解释，应该是我向你学习
TA的每日心情开心 10:46签到天数: 64 天[LV.6]常住居民II
这个东西不太懂，好像又先天的免疫力，虽然认真学习了，但还是半懂半不懂。
TA的每日心情奋斗 12:16签到天数: 102 天[LV.6]常住居民II
这些问题主要是忽视卡方检验的应用条件，如果知道应用条件，就不会犯这些错误& && &
TA的每日心情奋斗 08:14签到天数: 80 天[LV.6]常住居民II
学习了，谢谢分享！以后有不会的终于找到老师可以询问了
TA的每日心情奋斗 08:14签到天数: 1 天[LV.1]初来乍到
Fisher's精确检验是直接概率法，直接得到P值。无检验统计量值
谢谢老师的解答，但是我看老师您案例分析1第5行Fisher确切概率法给出了一个χ2=0.269，P=0.943，这个卡方值又是从哪里得出的呢，我在投文章的时候需要写上去吗？而且我看有些Fisher确切概率法监测结果又有检测值，希望老师能赐教，谢谢！C:\Documents and Settings\Administrator\桌面
TA的每日心情开心 08:17签到天数: 36 天[LV.5]常住居民I
谢谢老师的解答，但是我看老师您案例分析1第5行Fisher确切概率法给出了一个χ2=0.269，P=0.943，这个卡方 ...
1.卡方和Fisher精确精确检验都适应用于四格表，只不过适应条件不同（见8楼老师回复）
2.至于是采用卡方检验结果还是Fisher精确检验结果，需要见表下面的a解释，如本次说2个单元格期望值少于5，那么应该采用Fisher精确检验。
3.SPSS在四格表时是真正的Fisher精确概率法。在行数或列数大于2时，用的是模拟法，而非真正的Fisher精确概率法，故出现统计量值。
TA的每日心情奋斗 08:14签到天数: 1 天[LV.1]初来乍到
1.卡方和Fisher精确精确检验都适应用于四格表，只不过适应条件不同（见8楼老师回复）
2.至于是采用卡方 ...
非常感谢老师的解答！
TA的每日心情奋斗 08:13签到天数: 107 天[LV.6]常住居民II
这方面的知识欠缺，学习并收藏慢慢消化！
Powered by您现在的位置：&&>&&>&&>&&>&正文
医学统计之星
在很久很久以前，地球上还是一个阴森恐怖的黑暗时代，大地上恐龙横行，我们的老祖先－－类人猿惊恐的睁大了双眼，围坐在仅剩的火堆旁，担心着无边的黑暗中不知何时会出现的妖魔鬼怪，没有电视可看，没有网可上...
我是疯了，还是在说梦话？都不是，类人猿自然不会有机会和恐龙同时代，只不过是我开机准备写这一部分的时候，心里忽然想到，在10年前，国内的统计学应用上还是卡方检验横行，分层的M-H卡方简直就是超级武器，在流行病学中称王称霸，更有那些1：M的配对卡方，N：M的配对卡方，含失访数据的N：M配对卡方之类的，简直象恐龙一般，搞得我头都大了。其实恐龙我还能讲出十多种来，可上面这些东西我现在还没彻底弄明白，好在社会进步迅速，没等这些恐龙完全统制地球，Logistic模型就已经飞速进化到了现代人的阶段，各种各样的Logistic模型不断地在蚕食着恐龙爷爷们的领地，也许还象贪吃的人类一样贪婪的享用着恐龙的身体。好，这是好事，这里不能讲动物保护，现在我们就远离那些恐龙，来看看现代白领的生活方式。
特别声明：我上面的话并非有贬低流行病学的意思，实际上我一直都在做流行病学，我这样写只是想说明近些年来统计方法的普及速度之快而已。
据我一位学数学的师兄讲，Logistic模型和卡方在原理上是不一样的，在公式推演上也不可能划等号，只是一般来说两者的检验结果会非常接近而已，多数情况下可忽略其不同。
§10.3 Binary Logistic过程
所谓Logistic模型，或者说Logistic回归模型，就是人们想为两分类的应变量作一个回归方程出来，可概率的取值在0~1之间，回归方程的应变量取值可是在实数集中，直接做会出现0~1范围之外的不可能结果，因此就有人耍小聪明，将率做了一个Logit变换，这样取值区间就变成了整个实数集，作出来的结果就不会有问题了，从而该方法就被叫做了Logistic回归。
随着模型的发展，Logistic家族也变得人丁兴旺起来，除了最早的两分类Logistic外，还有配对Logistic模型，多分类Logistic模型、随机效应的Logistic模型等。由于SPSS的能力所限，对话框只能完成其中的两分类和多分类模型，下面我们就介绍一下最重要和最基本的两分类模型。
<FONT color=#.3.1 界面详解与实例
例11.1 某研究人员在探讨肾细胞癌转移的有关临床病理因素研究中，收集了一批行根治性肾切除术患者的肾癌标本资料，现从中抽取26例资料作为示例进行logistic回归分析（本例来自《卫生统计学》第四版第11章）。
i：标本序号
x1：确诊时患者的年龄(岁)
x2：肾细胞癌血管内皮生长因子(VEGF)，其阳性表述由低到高共3个等级&
x3：肾细胞癌组织内微血管数(MVC)&
x4：肾癌细胞核组织学分级，由低到高共4级&
x5：肾细胞癌分期，由低到高共4期&
y：肾细胞癌转移情况(有转移y=1; 无转移y=0)。
在菜单上选择Analyze==》Regression==》Binary Logistic...，系统弹出Logistic回归对话框如下：
左侧是候选变量框，右上角是应变量框，选入二分类的应变量，下方的Covariates框是用于选入自变量的，只不过这里按国外的习惯被称为了协变量。两框中间的是BLOCK系列按扭，我在上一课已经讲过了，不再重复。中下部的&a*b&框是用于选入交互作用的，和其他的对话框不太相同（我也不知道为什么SPSS偏在这里做得不同），下方的Method列表框用于选择变量进入方法，有进入法、前进法和后退法三大类，三类之下又有细分。最下面的四个按钮比较重要，请大家听我慢慢道来：
Select&&钮：用于限定一个筛选条件，只有满足该条件的记录才会被纳入分析，单击它后对话框会展开让你填入相应的条件。不过我觉得该功能纯属多余，和专门的Select对话框的功能重复了。
Categorical钮：如果你的自变量是多分类的（如血型等），你必须要将它用哑变量的方式来分析，那么就要用该按钮将该变量指定为分类变量，如果有必要，可用里面的选择按钮进行详细的定义，如以哪个取值作为基础水平，各水平间比较的方法是什么等。当然，如果你弄不明白，不改也可以，默认的是以最大取值为基础水平，用Deviance做比较。
Save钮：将中间结果存储起来供以后分析，共有预测值、影响强度因子和残差三大类。
Options钮：这一部分非常重要，但又常常被忽视，在这里我们可以对模型作精确定义，还可以选择模型预测情况的描述方式，如Statistics and Plots中的Classification plots就是非常重要的模型预测工具，Correlations of estimates则是重要的模型诊断工具，Iteration history可以看到迭代的具体情况，从而得知你的模型是否在迭代时存在病态，下方则可以确定进入和排除的概率标准，这在逐步回归中是非常有用的。
好，根据我们的目的，应变量为Y，而X1~X5为自变量，具体的分析操作如下：
Analyze==》Regression==》Binary Logistic...
Dependent框：选入Y
Covariates框：选入x1~x5
OK钮：单击
<FONT color=#.3.2 结果解释
Logistic Regression
上表为记录处理情况汇总，即有多少例记录被纳入了下面的分析，可见此处因不存在缺失值，26条记录均纳入了分析。
上表为应变量分类情况列表，没什么好解释的。
Block 0: Beginning Block
此处已经开始了拟合，Block 0拟合的是只有常数的无效模型，上表为分类预测表，可见在17例观察值为0的记录中，共有17例被预测为0，9例1也都被预测为0，总预测准确率为65.4%，这是不纳入任何解释变量时的预测准确率，相当于比较基线。
上表为Block 0时的变量系数，可见常数的系数值为-0.636。
上表为在Block 0处尚未纳入分析方程的侯选变量，所作的检验表示如果分别将他们纳入方程，则方程的改变是否会有显著意义（根据所用统计量的不同，可能是拟合优度，Deviance值等）。可见如果将X2系列的哑变量纳入方程，则方程的改变是有显著意义的，X4和X5也是如此，由于Stepwise方法是一个一个的进入变量，下一步将会先纳入P值最小的变量X2，然后再重新计算该表，再做选择。
Block 1: Method = Forward Stepwise (Conditional)
此处开始了Block 1的拟合，根据我们的设定，采用的方法为Forward（我们只设定了一个Block，所以后面不会再有Block 2了）。上表为全局检验，对每一步都作了Step、Block和Model的检验，可见6个检验都是有意义的。
此处为模型概况汇总，可见从STEP1到STEP2，DEVINCE从18降到11，两种决定系数也都有上升。
此处为每一步的预测情况汇总，可见准确率由Block 0的65%上升到了84%，最后达到96%，效果不错，最终只出现了一例错判。
上表为方程中变量检验情况列表，分别给出了Step 1和Step 2的拟合情况。注意X4的P值略大于0.05，但仍然是可以接受的，因为这里用到的是排除标准（默认为0.1），该变量可以留在方程中。以Step 2中的X2为例，可见其系数为2.413，OR值为11。
上表为假设将这些变量单独移出方程，则方程的改变有无统计学意义，可见都是有统计学意义的，因此他们应当保留在方程中。
最后这个表格说明的是在每一步中，尚未进入方程的变量如果再进入现有方程，则方程的改变有无统计学意义。可见在Step 1时，X4还应该引入，而在Step 2时，其它变量是否引入都无关了。
<FONT color=#.3.3 模型的进一步优化与简单诊断
10.3.3.1 模型的进一步优化
前面我们将X1~X5直接引入了方程，实际上，其中X2、X4、X5这三个自变量为多分类变量，我们并无证据认为它们之间个各等级的OR值是成倍上升的，严格来说，这里应当采用哑变量来分析，即需要用Categorical钮将他们定义为分类变量。但本次分析不能这样做，原因是这里总例数只有26例，如果引入哑变量模型会使得每个等级的记录数非常少，从而分析结果将极为奇怪，无法正常解释，但为了说明哑变量模型的用法，下面我将演示它是如何做的，毕竟不是每个例子都只有26例。
默认情况下定义分类变量非常容易，做到如上图所示就可以了，此时分析结果中的改变如下：
上表为自变量中多分类变量的哑变量取值情况代码表。左侧为原变量名及取值，右侧为相应的哑变量名及编码情况：以X5为例，表中可见X5=4时，即取值最高的情况被作为了基线水平，这是多分类变量生成哑变量的默认情况。而X5(1)代表的是X5=1的情况（X5为1时取1，否则取0），X5(2)代表的是X5=2的情况，依此类推。同时注意到许多等级值有几个记录，显然后面的分析结果不会太好。
相应的，分析结果中也以哑变量在进行分析，如下所示：
上表出现了非常有趣的现象：所有的检验P值均远远大于0.05，但是所有的变量均没有被移出方程，这是怎么回事？再看看下面的这个表格吧。
这个表格为方程的似然值改变情况的检验，可见在最后Step 2生成的方程中，无论移出X2还是X4都会引起方程的显著性改变。也就是说，似然比检验的结果和上面的Walds检验结果冲突，以谁为准？此处应以似然比检验为准，因为它是全局性的检验，且Walds检验本身就不太准，这一点大家记住就行了，实在要弄明白请去查阅相关文献。
请注意：上面的哑变量均是以最高水平为基线水平，这不符合我们的目的，我们希望将最低水平作为基线水平。比如以肾细胞癌第一期为基线水平，需要这样做只要在Categoriacl框中选中相应的变量，在Reference Category处选择First,再单击Change即可，此时变量旁的标示会做出相应的改变如下：
分析结果中也会做出相应的改变，此处略。
10.3.3.2 模型的简单诊断
SPSS本身提供了几种用于模型诊断的工具，基本上都集中在Options对话框中，除了大家熟悉的残差分析外，这里这种介绍三种简单而有非常有用的工具：迭代记录、相关矩阵和分类图。
上表为Block 1的迭代记录，可见无论是似然值，还是三个系数值，均是从迭代开始就向着一个方向发展，最终达到收敛，这说明整个迭代过程是健康的，问题不大；如果中途出现波折，尤其是当引入新变量后变化方向改变了，则提示要好好研究。
上表为方程中变量的相关矩阵，可见X2和常数相关性较强，当引入X4后仍然如此，提示要关注这一现象，以防因自变量间的共线性导致方程系数不稳（此时迭代记录多半也会有波动）。当然，由于本例只有26条记录，这一问题是没有办法深入研究的。
上图是Step 1结束时，即只引入X2时的预测图，0和1代表实际取值，当预测的概率值大于0.5时，则预测结果为1，反之为0，由上图可见，该模型对0的预测是比较好的，多数的概率都在0附近，但对1的预测不准，即使正确的，计算出的概率也在0.8左右，并且有好几个都判错了。
上图为Step 2结束后模型的预测状况，可见此时预测结果有了较大的改善，概率精度提高了许多，只有一例0被错判为了1，并且从分布上看，这一例可能是极端情况，再引入其它变量也不见的能将预测效果改变多少。
众说风云 (已有2条评论)
* 游客填写 & &* 用户名
上海、北京及广州生物技术相关行业最新的职位信息，尽在生物招聘。
成功的秘诀
关注2009――危机下的就业形势
Eppendorf 荧光定量 PCR仪
ABI Stepone TM 实时定量PCR仪，最新的软件系统，界面友好，操作简单
各种厂家和各种规格的PCR产物纯化试剂盒
最全的定量PCR试剂
从引物设计到实验全程服务全站分类导航
|||||||||||||||
|||||||||||||||
版权所有& CopyRight , MED126.COM, All Rights Reserved以下试题来自：
问答题简述病例对照研究中1:1匹配资料的分析步骤。病例对照研究中1:1匹配资料的分析步骤包括：(1)将研究资料整理成下列四格表形式。1:1配对的病例对照资料</......
为您推荐的考试题库
你可能感兴趣的试题
OR＝2.06。胚胎期暴露于X线儿童患癌的危险是胚胎期未暴露于X线儿童患癌危险的2.06倍。
病例对照研究中病例和对照的来源及其匹配：
3.问答题 (1)研究设计阶段：做好研究对象的选择，保证研究对象的代表性和可比性。(2)实施阶段：在调查实施过程中，对病例和对照的观...... 4.问答题不匹配不分层资料的分析步骤包括：(1)将研究资料整理成下列四格表形式。病例对照研究资料。(2)应用卡方检验分析病...... 5.问答题优点：(1)简便、快速、省费用，因此尤其适于潜伏期长的疾病的研究。(2)尤其适于罕见病的研究。(3)可以同时研......
热门相关试卷
最新相关试卷流行病学与统计_百度文库
两大类热门资源免费畅读
续费一年阅读会员，立省24元！
流行病学与统计
阅读已结束，下载本文需要
想免费下载本文？
定制HR最喜欢的简历
下载文档到电脑，方便使用
还剩10页未读，继续阅读
定制HR最喜欢的简历
你可能喜欢

流行病学资料中的匹配资料卡方值是怎么算出来的。

我要回帖

更多关于脑卒中流行病学的文章

随机推荐

流行病学资料中的匹配资料卡方值是怎么算出来的。

我要回帖

更多关于 脑卒中流行病学 的文章

随机推荐

更多关于脑卒中流行病学的文章