p=0.998 做统计，二项logistic回归分析，筛选出3个有意义的因素，sig（p）=0.999和0.998，请问怎么解释？

羽毛球技术 | 体育赛事 | 英文歌曲 | 住宅风水 | 用户界面设计师 | 六爻 | 书籍改编电影 | 德国足球甲级联赛 | 欧美明星 | PLC | 中国足球 | aj1 | 国家队 | 拜仁慕尼黑足球俱乐部 | 小说创作 | 配音 | iOS应用 | NBA 2K | 古典音乐 | 面相 | 火影忍者 | 武汉大学 | 土拨鼠 | 营销策划 | 秦时明月之天行九歌 | 设计师 | 巴塞罗那足球俱乐部 | 尤文图斯 | 实况足球（游戏） | 少帅 | 罗玉凤 | 比利时 | 跑鞋 | 冷知识 | 肖战 | 李元胜 | 古琴 | 按键精灵 | 罗兰 | 徐波 | 激光手术 | 角色扮演 | 关晓彤 | 微电影 | safari | 北京国安 | 古汉语 | 曼彻斯特联 | 玄幻小说 | 科幻小说 | 双眼皮手术 | 主题曲 | 年会 | 检测仪 | 徒步 | 互联网公司 | 百度输入法 | 镜头 | 宜昌市 | 自拍 | 金蝶 | 电子烟 | 网站建设 | 广播体操 | 文身 | nba篮球 | 索尼(sony) | 天体物理学 | 痛风 | 象棋 | 牛皮癣 | 皮肤护理 | 周星驰（人物） | 试管婴儿 | 亚足联亚洲杯（AFC Asian Cup） | 健美 | 美术生 | 迅雷（软件） | 战斗机 | 穿越小说 | 张璐 | 姓氏 | 诸葛亮 | 后宫·甄嬛传（书籍） | 虎牙直播 | snh48 | 阿迪达斯 | 投影仪 | 组装机 | 微信群 | 阿迪达斯(adidas) | 网球王子 | 分子生物学 | 耽美 | 武磊 | 婚礼 | 表演 | 中国武术 | 动画电影 | Air Jordan | 张子枫 | 免费软件 | 相声演员 | 摩羯座 | 宿舍 | ansys | 法国足球甲级联赛 | 户外 | 剧场版 | 杨凡 | 科幻电影 | galgame | 融资 | 关节炎 | NBA季后赛 | 神话 | 王力宏（人物） | 建模 | 计算机病毒 | 广州恒大淘宝足球俱乐部 | 北京奥运会 | 电脑电源 | 百度翻译 | 字幕 | 讯飞输入法 | 海关 | 易烊千玺 | 深度学习 | 编辑器 | 澳门特别行政区 | 直播 | 流氓软件 | 事故 | 大片 | 李景亮 | 郭富城 | 日语歌曲 | 卡牌游戏 | 小品 | 东京 | 花卉 | 音乐剧 | 互联网创业 | 占卜 | 羽毛球拍 | 婆媳关系 | 日本动画 | 巴黎 | 拳击比赛 | 东南亚 | 足球经理（FM）（游戏） | youtube | 胡歌（演员） | 地铁跑酷 | 植发 | 张继科 | 三国 | 用户界面 | 演技 | 百度竞价 | 青梅竹马 | 移动硬盘 | 韩晓鹏 | 马龙 | 瘦腿 | 宠物医疗 | 巨蟹座 | 徐峥 | 天蝎座 | 胸肌 | 赵丽颖（演员） | adidas阿迪达斯 | 低音炮 | 星际争霸（游戏） | 豆瓣电影 | 微信开放平台 | 手绘 | 吉他学习 | 江苏卫视 | 模特 | 创意 | 团队管理 | 奢侈品 | 王源 | TANK | 笛子 | 偶像 | 莱斯特城 | 维生素 | 新百伦 | 国际物流 | 前女友 | 李小龙 | 华语流行音乐 | 猎头公司 | crm | 搏击项目 | 网站运营 | 鼻炎 | 篮球游戏 |

你的位置：网站首页 >> 频道首页 >>数学 >>p=0.998 做统计，二项logistic回归分析，筛选出3个有意义的因素，sig（p）=0.999和0.998，请问怎么解释？

p=0.998 做统计，二项logistic回归分析，筛选出3个有意义的因素，sig（p）=0.999和0.998，请问怎么解释？

来源：蜘蛛抓取(WebSpider) 时间：2012-06-15 14:04 标签： logistic回归分析

Logistic回归_图文_百度文库
两大类热门资源免费畅读
续费一年阅读会员，立省24元！
评价文档：
Logistic回归
上传于||文档简介
&&基础医学 统计学
大小：1.11MB
登录百度文库，专享文档复制特权，财富值每天免费拿！
你可能喜欢|/|/|/|/|/|
//|//|//|//|//|
求教logistic回归问题
自变量为多分类无序变量，亚变量应该怎样设订，结果又应该怎么解释。你的亚变量是不是说dummy variable，中文好像是“哑”变量?（但愿我的理解没错）。多分类变量的效应在回归中一般是这样作的：设定某个类别为基础类别，然后将其它类别与其比较。举个例子，血型问题：A, B, O,AB, 可以设为：A
0在这个设定中AB是基本的reference level.在实际应用中，有多种dummy variable 设定方式可供选择，这决定于你要建立的模型。上述的方法只是基础的一种。其它方法还有Effect，polynomial, 和 orthpoly等等。请参阅有关的参考书。哑变量的个数为n-1，n为多分类变量的类别数，比如假设x变量为血型，有4类（A、B、AB、O型），则哑变量应为3个，（X1、X2、X3），（0，0，0）（1，0，0）（1，1，0）（1，1，1）分别代表4种血型。建议用SAS里的CATMOD过程做分析，则不用设哑变量。若用Logistic过程做，必须设哑变量。当结果出现时，可写出回归方程，然后将X1、X2、X3的值带入即可。qionghongduan wrote:......若用Logistic过程做，必须设哑变量。......错！你还不够熟悉SAS指定class变量，也可以省去设定哑变量的步骤。见笑了抱歉抱歉!fyzzz 兄，犯了如此愚蠢的错误,打错了,应该是哑变量谢谢qionghongduan兄。sas中的哑变量还可以通过该语句指定：xuexingA=(xuexing='A')xuexingB=(xuexing='B）xuexingO=(xuexing='O'）请教该三个哑变量如果进入回归方程，且偏回归系数有意义，那么该怎样解释？假设分析某疾病的发生与血型之间的关系做法正确xuexingA=(xuexing='A')使A=1，其他为 0......同时将他们放入模型就可以。在SAS中这样：MODEL disease ＝ xuexingA xuexingB xuexingO ...other factors记住一点，在这个模型中，A,B,O都是在和AB血型的比较下显示对disease的效应的。比如，Beta for xuexingB 检验有显著性，则应该说：和AB血型相比，B血型将增加（减少）disease 的危险性。教你一个减少编程的方法。在实际应用中，如果遇到多个分类变量，每个都如此dummy则程序会变得臃肿不堪。事实上，高版本的SAS中在PROC LOGISTIC中加入了CLASS语句。充分利用Class语句的功能，就没必要去写上述你写的语句了。假设血型变量为 typePROC LOGISTIC DATA=xxx；CLASS type (ref='AB');**********就此一个语句完成你上述所作的dummy工作;MODEL disease ＝ type ...这个模型给出的参数在type下应有 3 个。解释和上述相同。fyzzz兄确实是精通统计软件,本人年纪较大,总是留恋老版本的软件,看来以后要努力学习,更新知识,也要多向你请教.qionghongduan wrote:fyzzz兄确实是精通统计软件,本人年纪较大,总是留恋老版本的软件,看来以后要努力学习,更新知识,也要多向你请教.谦虚了。互相学习吧fyzzz兄和qionghongduan兄的讨论非常好，两位都精通SAS，希望两位能够保持对论坛的热情，多多参与讨论、答疑和管理工作，谢谢支持！哑变量我其实很少用到，因为处理的样本量多数比较小，一般遇到多分类无序自变量，能合并的就合并了，分的太细有时候也不好；而且我一般都做逐步回归，有时就用于筛选指标，不设哑变量。当然设了哑变量能够得到更丰富的信息。一点浅见，不知道说的对不对，见笑！请教两位2个问题：1.假设血型变量为 typeCLASS type (ref='AB');**********就此一个语句你上述所作的dummy工作;该语句在Cox回归中应该也可以用于设定哑变量吧？2.因为做逐步回归，应该可以把4种血型分开为4个二项分类变量，以探讨何种血型是重要的危险因子，SAS语句为：A,B,O,AB分别用1、2、3、4表示；if xuexing=1 then xuexingA=1;else xuexingA=0;if xuexing=2 then xuexingB=1;else xuexingB=0;if xuexing=3 then xuexingC=1;else xuexingC=0;if xuexing=4 then xuexingD=1;else xuexingD=0;proc logistic data=xxx；model disease=xuexingA xuexingB xuexingC xuexingD…………这有简化程序吗？本来我是很喜欢用SAS的，可自从做了本版版主之后，SAS用的是越来越少，以前一些伸手就来的程序，现在不看书根本不行，何况本来SAS的基础就没打好，十分郁闷，恳请两位指教，非常感谢！哑变量我其实很少用到，因为处理的样本量多数比较小，一般遇到多分类无序自变量，能合并的就合并了，分的太细有时候也不好；而且我一般都做逐步回归，有时就用于筛选指标，不设哑变量。当然设了哑变量能够得到更丰富的信息。一点浅见，不知道说的对不对，见笑！如果要更深入的了解因素的效应，哑变量应该是必须的1.假设血型变量为 typeCLASS type (ref='AB');**********就此一个语句完成你上述所作的dummy工作;该语句在Cox回归中应该也可以用于设定哑变量吧？在SAS V8.2 的PROC PHREG还不可以。不知道后续版本会不会有所改进。不过，在我所使用过的统计软件中，倒是有可以这样作的。2.因为做逐步回归，应该可以把4种血型分开为4个二项分类变量，以探讨何种血型是重要的危险因子，SAS语句为：A,B,O,AB分别用1、2、3、4表示；if xuexing=1 then xuexingA=1;else xuexingA=0;if xuexing=2 then xuexingB=1;else xuexingB=0;if xuexing=3 then xuexingC=1;else xuexingC=0;if xuexing=4 then xuexingD=1;else xuexingD=0；proc logistic data=xxx；model disease=xuexingA xuexingB xuexingC xuexingD…………这有简化程序吗？这样作和dummy过程的解释应该有所不同。因为语句 “if xuexing=1 then xuexingA=1;else xuexingA=0” 所作的比较是A和B+O+AB之间的比较；只不过，A的效应是在control了xuexingB xuexingC xuexingD的情况下的得到的。这和dummy过程中与设定某个特定的reference level 有些不同。解释的时候应该注意到这点。这种做法隐含者某种缺陷，会导致发现不了应该有的效应（我指的是：A只和某个血型比有显著性，但和B+O+AB这些血型的综合比可能就没有显著性）。我手头就有这样的数据。大家也可以在实践中发现这个问题的。这时，哑变量的过程似乎更好一些。不过要想充分了解实际的情况，一次哑变量的回归对这样的例子似乎不够。因为4分类的两两比较可以组合出6个。而一次回归只进行了三次比较。所以，可行的方法是，选不同的类作为reference level，进行多次回归。以上仅是我的理解，欢迎指正感谢fyzzz兄的指导！我们版讨论SAS的内容比较少，很希望您能多多参与，也十分欢迎把您实践中的体会分享一下！如果您把更多的精力和时间投入到专业化建设中，检索版少去一些，将有助于您在DXY的发展。哑变量的问题比较烦，Logistic的输出结果本来就已经不少，想到要做几次才能作出全部结果来，的确头痛！我们遇到的资料中多分类无序自变量很少（不多的几个也合并，也没办法，有时候一组病例很少的），多分类有序自变量比较多，一般情况下，后者在SAS中也不用设置哑变量了。另外请教SAS的Cox回归过程难道不能设置哑变量吗？楼上的xuexingA=(xuexing='A')；xuexingB=(xuexing='B）；xuexingO=(xuexing='O'）；程序也不行吗？SPSS中可以挺容易的设定的，不知在这一点上SAS是不是有点失败？fengyouxin wrote:感谢fyzzz兄的指导！不敢说是指导，相互探讨对我自己也是个促进我们版讨论SAS的内容比较少，很希望您能多多参与，也十分欢迎把您实践中的体会分享一下！如果您把更多的精力和时间投入到专业化建设中，检索版少去一些，将有助于您在DXY的发展。现在是有空才来，那边也好长时间没去了另外请教SAS的Cox回归过程难道不能设置哑变量吗？您误解了。我是说CLASS在PROC PHREG中不起作用。楼上的xuexingA=(xuexing='A')；xuexingB=(xuexing='B）；xuexingO=(xuexing='O'）；程序也不行吗？请运行这个小程序,察看结果：input xuexing $4.; A B O A B AB O ;xuexingA=(xuexing='A');xuexingB=(xuexing='B');xuexingO=(xuexing='O');SPSS中可以挺容易的设定的，不知在这一点上SAS是不是有点失败？应该说各有所长作单因素分析（CMH法并进行分割做了两两比较），AB血型发病率要显著高于其他血型，多因素分析用LOGISTIC回归，将血型指定哑变量以AB型为参照（即隐含变量），结果发现A、B血型进入模型，且偏回归系数大于0，统计学检验有意义P&0.05，结果该如何解释呢？LOGISTIC回归中，对模型拟合优度检验无意义（P&0.05），对模型检验有意义（对BEAT是否全部为0检验），该怎么处理呢？LOGISTIC回归,自变量为多分类有序变量，可否也用哑变量的方法分析，我个人认为这样做的好处是可以发现具体的哪一段为危险因素。goodman5160 wrote:...LOGISTIC回归中，对模型拟合优度检验无意义（P&0.05）...请说明一下用的是何种检验, Lack of fit? goodman5160 wrote:LOGISTIC回归,自变量为多分类有序变量，可否也用哑变量的方法分析，我个人认为这样做的好处是可以发现具体的哪一段为危险因素。不好，尽管可以用。对有序分类，趋势检验更适合拟合优度检验我用了剩余差和pearson卡方检验，sas 选项为aggregate；也用了适合二值响应模型的hosmer和lemeshow拟合优度检验，sas选项为
lackfit；结果都是一致的，模型拟合优度检验p&0.05这说明模型拟合不好，需要调整。BTW：任何检验都有H0和H1假设的，有些还有适用方面的限制。建议你查一查这些检验的假设，有助于你解读结果，而且可以避免盲目应用。作单因素分析（CMH法并进行分割做了两两比较），AB血型发病率要显著高于其他血型，多因素分析用LOGISTIC回归，将血型指定哑变量以AB型为参照（即隐含变量），结果发现A、B血型进入模型，且偏回归系数大于0，统计学检验有意义P&0.05，结果该如何解释呢？本应是以保护因素进入模型，单却以危险因素进入模型。请问fyzzz兄应该如何调整，应变量为二分类，因变量大多数为多分类名义型变量（设置了哑变量），也有几个多分类有序变量，样本例数足够大（5000），分析的变量个数为10几个。建议你查一查这些检验的假设，有助于你解读结果，而且可以避免盲目应用不知您指的是那些检验的假设，小弟的参考书关于LOGISTIC回归方面介绍非常粗略。goodman5160 wrote:作单因素分析（CMH法并进行分割做了两两比较），AB血型发病率要显著高于其他血型，多因素分析用LOGISTIC回归，将血型指定哑变量以AB型为参照（即隐含变量），结果发现A、B血型进入模型，且偏回归系数大于0，统计学检验有意义P&0.05，结果该如何解释呢？本应是以保护因素进入模型，单却以危险因素进入模型。请问fyzzz兄应该如何调整，应变量为二分类，因变量大多数为多分类名义型变量（设置了哑变量），也有几个多分类有序变量，样本例数足够大（5000），分析的变量个数为10几个。你没有仔细阅读SAS关于logistic的细节说明。假设你的应变量是0/1编码的：SAS在作logistic 回归时，default情况下是对0进行回归。如果0是没有疾病，则回归的结果是，哪些变量对没有疾病有意义。对模型的选择，可以用逐步回归的方法去选择可以保留在模型中的保留，或者根据经验去组合模型（比方，某些因素不可能与疾病相关，就没有必要把它放在模型中）。goodman5160 wrote:建议你查一查这些检验的假设，有助于你解读结果，而且可以避免盲目应用不知您指的是那些检验的假设，小弟的参考书关于LOGISTIC回归方面介绍非常粗略。我指的是，像lackfit这样的检验。如果你清楚它的假设的话，你判断模型拟合的好不好时就不会有疑问。fyzzz wrote:你没有仔细阅读SAS关于logistic的细节说明。假设你的应变量是0/1编码的：SAS在作logistic 回归时，default情况下是对0进行回归。如果0是没有疾病，则回归的结果是，哪些变量对没有疾病有意义。对模型的选择，可以用逐步回归的方法去选择可以保留在模型中的保留，或者根据经验去组合模型（比方，某些因素不可能与疾病相关，就没有必要把它放在模型中）。我在LOGISTIC逐步回归中加了descending选项的，我知道还可以用order=data,结果还是我前面说的那样，我觉得解释不通，特请教fz兄我指的是，像lackfit这样的检验。如果你清楚它的假设的话，你判断模型拟合的好不好时就不会有疑问。无效假设是模型拟合不好，p&0.05时，不拒绝无效假设，即没有理由认为模型拟合不好。我做出来的p&0.05,我不知该怎么处理。我上面说了，这个模型需要调整。试试逐步回归。在模型还没建好之前，就急于看结果，不是好习惯。不成立的模型给出的结果都不能用。fyzzz wrote:我上面说了，这个模型需要调整。试试逐步回归。在模型还没建好之前，就急于看结果，不是好习惯。不成立的模型给出的结果都不能用。小弟做的就是逐步回归，且根据专业自变量已经作过了筛选，然后才建模。小弟就是不知道该怎样调整，还请fz兄明示。小弟是跑完程序看到结果，不知如何解释才感到困惑的。由于拟合优度检验P&0.05 ，本应是保护因素偏回归系数却大于0，而不知该怎样处理？你还可以从两个方面着手：1. 分层分析，就所有可能的混杂因子进行分层，弄明白混杂效应的方向；2. 在模型中增加交互相寻找一个合理的模型并不简单，有时候是一项相当复杂的工作。不要怕烦，多试，建立了合理的模型以后，再看结果。多谢fz兄。分层分析的 logisitc回归sas应该如何编程呢？用by语句就可以。多谢！我先试试在大样本的情况下,作logistic逐步回归，常会出现偏回归系数的检验有意义（p值接近界值），OR值的95％的可信区间包含1，这种情况下该如何调整呢？结论该如何下（该依据谁）fyzzz兄，请指教。该怎么办呢goodman5160 wrote:在大样本的情况下,作logistic逐步回归，常会出现偏回归系数的检验有意义（p值接近界值），OR值的95％的可信区间包含1，这种情况下该如何调整呢？结论该如何下（该依据谁）一种可能是：这反映的是事实。这样的话，无论如何调整，都无法改变这种状态。文字上可以直接表明这种P值，或者区间值和相应的显著性水平。相应的任何说法都要慎重。至于“该依据谁”，不应该是问题，因为”p值接近界值“
与 “OR值的95％的可信区间包含1” 有时候是数值四舍五入的数学原因造成的，二者不存在冲突。另一种可能：连续型变量直接进入模型也有可能出现这种状况。对这种情况，可以尝试： 1)将连续型数据转为分类型数据；2)在SAS中使用unit语句，就是改变连续型数据的“单位”差距。fyzzz wrote:一种可能是：这反映的是事实。这样的话，无论如何调整，都无法改变这种状态。文字上可以直接表明这种P值，或者区间值和相应的显著性水平。相应的任何说法都要慎重。至于“该依据谁”，不应该是问题，因为”p值接近界值“
与 “OR值的95％的可信区间包含1” 有时候是数值四舍五入的数学原因造成的，二者不存在冲突。另一种可能：连续型变量直接进入模型也有可能出现这种状况。对这种情况，可以尝试： 1)将连续型数据转为分类型数据；2)在SAS中使用unit语句，就是改变连续型数据的“单位”差距。我想我遇到应是第一种情况，因为我以将资料中的连续型变量变为了多分类，结果依然出现了这种情况。至于该依据谁我还是有些不明白。虽然P接近界值但是仍然是小于界值的，如果按界值标准下结论，（假定偏回归系数为正）我依然可以认为其为危险因素，是不是可以不考虑OR值95％的可信区间包含1呢？请问各位老师:我做死亡危险因素时,单因素分析找到六个变量有意义(T检验\卡方检验),再用SPSS做LOGISTIC回归,(按照马斌荣老师出的教材方法去做),出来的方程就没有意义,而且所有变量P值均接近1,但我随便用两个变量(其中一个是单因素有意义,一个单因素无意义)做LOGISTIC回归,方程及变量均有意义,但拟合度只有63%,如何解释?我该怎么办????
您的位置： &&【图文】Logistic回归分析及应用_百度文库
两大类热门资源免费畅读
续费一年阅读会员，立省24元！
评价文档：
Logistic回归分析及应用
上传于||暂无简介
大小：1.76MB
登录百度文库，专享文档复制特权，财富值每天免费拿！
你可能喜欢虚拟变量与logistic回归练习题_百度文库
两大类热门资源免费畅读
续费一年阅读会员，立省24元！
虚拟变量与logistic回归练习题
上传于||文档简介
&&SPSS中虚拟变量与logisic练习
阅读已结束，如果下载本文需要使用1下载券
想免费下载本文？
定制HR最喜欢的简历
下载文档到电脑，查找使用更方便
还剩5页未读，继续阅读
定制HR最喜欢的简历
你可能喜欢logistic回归影响因素显著水平如何计算_百度知道

p=0.998 做统计，二项logistic回归分析，筛选出3个有意义的因素，sig（p）=0.999和0.998，请问怎么解释？

我要回帖

更多关于 logistic回归分析的文章

随机推荐

p=0.998 做统计，二项logistic回归分析，筛选出3个有意义的因素，sig（p）=0.999和0.998，请问怎么解释？

我要回帖

更多关于 logistic回归分析 的文章

随机推荐

更多关于 logistic回归分析的文章