p=0.998 做统计,二项logistic回归分析,筛选出3个有意义的因素,sig(p)=0.999和0.998,请问怎么解释?

Logistic回归_图文_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
Logistic回归
上传于||文档简介
&&基​础​医​学​ ​统​计​学
大小:1.11MB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢|/|/|/|/|/|
//|//|//|//|//|
求教logistic回归问题
自变量为多分类无序变量,亚变量应该怎样设订,结果又应该怎么解释 。你的亚变量是不是说dummy variable,中文好像是“哑”变量?( 但愿我的理解没错)。多分类变量的效应在回归中一般是这样作的:设定某个类别为基础类别,然后将其它类别与其比较。举个例子,血型问题:A, B, O,AB, 可以设为:A
0在这个设定中AB是基本的reference level.在实际应用中,有多种dummy variable 设定方式可供选择,这决定于你要建立的模型。上述的方法只是基础的一种。其它方法还有Effect,polynomial, 和 orthpoly等等。请参阅有关的参考书。哑变量的个数为n-1,n为多分类变量的类别数,比如假设x变量为血型,有4类(A、B、AB、O型),则哑变量应为3个,(X1、X2、X3),(0,0,0)(1,0,0) (1,1,0) (1,1,1)分别代表4种血型。建议用SAS里的CATMOD过程做分析,则不用设哑变量。若用Logistic过程做,必须设哑变量。当结果出现时,可写出回归方程,然后将X1、X2、X3的值带入即可。qionghongduan wrote:......若用Logistic过程做,必须设哑变量。......错!你还不够熟悉SAS指定class变量,也可以省去设定哑变量的步骤。见笑了抱歉抱歉!fyzzz 兄,犯了如此愚蠢的错误,打错了,应该是哑变量谢谢qionghongduan兄 。sas中的哑变量还可以通过该语句指定:xuexingA=(xuexing='A')xuexingB=(xuexing='B)xuexingO=(xuexing='O')请教该三个哑变量如果进入回归方程,且偏回归系数有意义,那么该怎样解释?假设分析某疾病的发生与血型之间的关系做法正确xuexingA=(xuexing='A')使A=1,其他为 0......同时将他们放入模型就可以。 在SAS中这样:MODEL disease = xuexingA xuexingB xuexingO ...other factors记住一点,在这个模型中,A,B,O都是在和AB血型的比较下显示对disease的效应的。比如,Beta for xuexingB 检验有显著性,则应该说:和AB血型相比,B血型将增加(减少)disease 的危险性。教你一个减少编程的方法。在实际应用中,如果遇到多个分类变量,每个都如此dummy则程序会变得臃肿不堪。事实上,高版本的SAS中在PROC LOGISTIC中加入了CLASS语句。充分利用Class语句的功能,就没必要去写上述你写的语句了。假设血型 变量为 typePROC LOGISTIC DATA=xxx;CLASS type (ref='AB');**********就此一个语句完成你上述所作的dummy工作;MODEL disease = type ...这个模型给出的参数在type下应有 3 个。解释和上述相同。fyzzz兄确实是精通统计软件,本人年纪较大,总是留恋老版本的软件,看来以后要努力学习,更新知识,也要多向你请教.qionghongduan wrote:fyzzz兄确实是精通统计软件,本人年纪较大,总是留恋老版本的软件,看来以后要努力学习,更新知识,也要多向你请教.谦虚了。互相学习吧fyzzz兄和qionghongduan兄的讨论非常好,两位都精通SAS,希望两位能够保持对论坛的热情,多多参与讨论、答疑和管理工作,谢谢支持!哑变量我其实很少用到,因为处理的样本量多数比较小,一般遇到多分类无序自变量,能合并的就合并了,分的太细有时候也不好;而且我一般都做逐步回归,有时就用于筛选指标,不设哑变量。当然设了哑变量能够得到更丰富的信息。一点浅见,不知道说的对不对,见笑!请教两位2个问题:1.假设血型 变量为 typeCLASS type (ref='AB');**********就此一个语句你上述所作的dummy工作;该语句在Cox回归中应该也可以用于设定哑变量吧?2.因为做逐步回归,应该可以把4种血型分开为4个二项分类变量,以探讨何种血型是重要的危险因子,SAS语句为:A,B,O,AB分别用1、2、3、4表示;if xuexing=1 then xuexingA=1;else xuexingA=0;if xuexing=2 then xuexingB=1;else xuexingB=0;if xuexing=3 then xuexingC=1;else xuexingC=0;if xuexing=4 then xuexingD=1;else xuexingD=0;proc logistic data=xxx;model disease=xuexingA xuexingB xuexingC xuexingD…………这有简化程序吗?本来我是很喜欢用SAS的,可自从做了本版版主之后,SAS用的是越来越少,以前一些伸手就来的程序,现在不看书根本不行,何况本来SAS的基础就没打好,十分郁闷,恳请两位指教,非常感谢!哑变量我其实很少用到,因为处理的样本量多数比较小,一般遇到多分类无序自变量,能合并的就合并了,分的太细有时候也不好;而且我一般都做逐步回归,有时就用于筛选指标,不设哑变量。当然设了哑变量能够得到更丰富的信息。一点浅见,不知道说的对不对,见笑!如果要更深入的了解因素的效应,哑变量应该是必须的1.假设血型 变量为 typeCLASS type (ref='AB');**********就此一个语句完成你上述所作的dummy工作;该语句在Cox回归中应该也可以用于设定哑变量吧?在SAS V8.2 的PROC PHREG还不可以。不知道后续版本会不会有所改进。不过,在我所使用过的统计软件中,倒是有可以这样作的。2.因为做逐步回归,应该可以把4种血型分开为4个二项分类变量,以探讨何种血型是重要的危险因子,SAS语句为:A,B,O,AB分别用1、2、3、4表示;if xuexing=1 then xuexingA=1;else xuexingA=0;if xuexing=2 then xuexingB=1;else xuexingB=0;if xuexing=3 then xuexingC=1;else xuexingC=0;if xuexing=4 then xuexingD=1;else xuexingD=0;proc logistic data=xxx;model disease=xuexingA xuexingB xuexingC xuexingD…………这有简化程序吗?这样作和dummy过程的解释应该有所不同。因为语句 “if xuexing=1 then xuexingA=1;else xuexingA=0” 所作的比较是A和B+O+AB之间的比较;只不过,A的效应是在control了xuexingB xuexingC xuexingD的情况下的得到的。这和dummy过程中与设定某个特定的reference level 有些不同。解释的时候应该注意到这点。这种做法隐含者某种缺陷,会导致发现不了应该有的效应(我指的是:A只和某个血型比有显著性,但和B+O+AB这些血型的综合比可能就没有显著性)。我手头就有这样的数据。大家也可以在实践中发现这个问题的。这时,哑变量的过程似乎更好一些。不过要想充分了解实际的情况,一次哑变量的回归对这样的例子似乎不够。因为4分类的两两比较可以组合出6个。而一次回归只进行了三次比较。所以,可行的方法是,选不同的类作为reference level,进行多次回归。以上仅是我的理解,欢迎指正感谢fyzzz兄的指导!我们版讨论SAS的内容比较少,很希望您能多多参与,也十分欢迎把您实践中的体会分享一下!如果您把更多的精力和时间投入到专业化建设中,检索版少去一些,将有助于您在DXY的发展。哑变量的问题比较烦,Logistic的输出结果本来就已经不少,想到要做几次才能作出全部结果来,的确头痛!我们遇到的资料中多分类无序自变量很少(不多的几个也合并,也没办法,有时候一组病例很少的),多分类有序自变量比较多,一般情况下,后者在SAS中也不用设置哑变量了。另外请教SAS的Cox回归过程难道不能设置哑变量吗?楼上的xuexingA=(xuexing='A');xuexingB=(xuexing='B);xuexingO=(xuexing='O');程序也不行吗?SPSS中可以挺容易的设定的,不知在这一点上SAS是不是有点失败?fengyouxin wrote:感谢fyzzz兄的指导!不敢说是指导,相互探讨对我自己也是个促进我们版讨论SAS的内容比较少,很希望您能多多参与,也十分欢迎把您实践中的体会分享一下!如果您把更多的精力和时间投入到专业化建设中,检索版少去一些,将有助于您在DXY的发展。现在是有空才来,那边也好长时间没去了另外请教SAS的Cox回归过程难道不能设置哑变量吗?您误解了。我是说CLASS在PROC PHREG中不起作用。楼上的xuexingA=(xuexing='A');xuexingB=(xuexing='B);xuexingO=(xuexing='O');程序也不行吗?请运行这个小程序,察看结果:input xuexing $4.; A B O A B AB O ;xuexingA=(xuexing='A');xuexingB=(xuexing='B');xuexingO=(xuexing='O');SPSS中可以挺容易的设定的,不知在这一点上SAS是不是有点失败?应该说各有所长作单因素分析(CMH法并进行分割做了两两比较),AB血型发病率要显著高于其他血型,多因素分析用LOGISTIC回归,将血型指定哑变量以AB型为参照(即隐含变量),结果发现A、B血型进入模型,且偏回归系数大于0,统计学检验有意义P&0.05,结果该如何解释呢?LOGISTIC回归中,对模型拟合优度检验无意义(P&0.05),对模型检验有意义(对BEAT是否全部为0检验),该怎么处理呢?LOGISTIC回归,自变量为多分类有序变量,可否也用哑变量的方法分析,我个人认为这样做的好处是可以发现具体的哪一段为危险因素。goodman5160 wrote:...LOGISTIC回归中,对模型拟合优度检验无意义(P&0.05)...请说明一下用的是何种检验, Lack of fit? goodman5160 wrote:LOGISTIC回归,自变量为多分类有序变量,可否也用哑变量的方法分析,我个人认为这样做的好处是可以发现具体的哪一段为危险因素。不好,尽管可以用。对有序分类,趋势检验更适合拟合优度检验我用了剩余差和pearson卡方检验,sas 选项为aggregate;也用了适合二值响应模型的hosmer和lemeshow拟合优度检验,sas选项为
lackfit;结果都是一致的,模型拟合优度检验p&0.05这说明模型拟合不好,需要调整。BTW:任何检验都有H0和H1假设的,有些还有适用方面的限制。建议你查一查这些检验的假设,有助于你解读结果,而且可以避免盲目应用。作单因素分析(CMH法并进行分割做了两两比较),AB血型发病率要显著高于其他血型,多因素分析用LOGISTIC回归,将血型指定哑变量以AB型为参照(即隐含变量),结果发现A、B血型进入模型,且偏回归系数大于0,统计学检验有意义P&0.05,结果该如何解释呢?本应是以保护因素进入模型,单却以危险因素进入模型。请问fyzzz兄应该如何调整,应变量为二分类,因变量大多数为多分类名义型变量(设置了哑变量),也有几个多分类有序变量,样本例数足够大(5000),分析的变量个数为10几个。建议你查一查这些检验的假设,有助于你解读结果,而且可以避免盲目应用不知您指的是那些检验的假设,小弟的参考书关于LOGISTIC回归方面介绍非常粗略。goodman5160 wrote:作单因素分析(CMH法并进行分割做了两两比较),AB血型发病率要显著高于其他血型,多因素分析用LOGISTIC回归,将血型指定哑变量以AB型为参照(即隐含变量),结果发现A、B血型进入模型,且偏回归系数大于0,统计学检验有意义P&0.05,结果该如何解释呢?本应是以保护因素进入模型,单却以危险因素进入模型。请问fyzzz兄应该如何调整,应变量为二分类,因变量大多数为多分类名义型变量(设置了哑变量),也有几个多分类有序变量,样本例数足够大(5000),分析的变量个数为10几个。你没有仔细阅读SAS关于logistic的细节说明。假设你的应变量是0/1编码的:SAS在作logistic 回归时,default情况下是对0进行回归。如果0是没有疾病,则回归的结果是,哪些变量对没有疾病有意义。对模型的选择,可以用逐步回归的方法去选择可以保留在模型中的保留,或者根据经验去组合模型(比方,某些因素不可能与疾病相关,就没有必要把它放在模型中)。goodman5160 wrote:建议你查一查这些检验的假设,有助于你解读结果,而且可以避免盲目应用不知您指的是那些检验的假设,小弟的参考书关于LOGISTIC回归方面介绍非常粗略。我指的是,像lackfit这样的检验。如果你清楚它的假设的话,你判断模型拟合的好不好时就不会有疑问。fyzzz wrote:你没有仔细阅读SAS关于logistic的细节说明。假设你的应变量是0/1编码的:SAS在作logistic 回归时,default情况下是对0进行回归。如果0是没有疾病,则回归的结果是,哪些变量对没有疾病有意义。对模型的选择,可以用逐步回归的方法去选择可以保留在模型中的保留,或者根据经验去组合模型(比方,某些因素不可能与疾病相关,就没有必要把它放在模型中)。我在LOGISTIC逐步回归中加了descending选项的,我知道还可以用order=data,结果还是我前面说的那样,我觉得解释不通,特请教fz兄我指的是,像lackfit这样的检验。如果你清楚它的假设的话,你判断模型拟合的好不好时就不会有疑问。无效假设是模型拟合不好,p&0.05时,不拒绝无效假设,即没有理由认为模型拟合不好。我做出来的p&0.05,我不知该怎么处理。我上面说了,这个模型需要调整。试试逐步回归。在模型还没建好之前,就急于看结果,不是好习惯。不成立的模型给出的结果都不能用。fyzzz wrote:我上面说了,这个模型需要调整。试试逐步回归。在模型还没建好之前,就急于看结果,不是好习惯。不成立的模型给出的结果都不能用。小弟做的就是逐步回归,且根据专业自变量已经作过了筛选,然后才建模。小弟就是不知道该怎样调整,还请fz兄明示。小弟是跑完程序看到结果,不知如何解释才感到困惑的。由于拟合优度检验P&0.05 ,本应是保护因素偏回归系数却大于0,而不知该怎样处理?你还可以从两个方面着手:1. 分层分析,就所有可能的混杂因子进行分层,弄明白混杂效应的方向;2. 在模型中增加交互相寻找一个合理的模型并不简单,有时候是一项相当复杂的工作。不要怕烦,多试,建立了合理的模型以后,再看结果。多谢fz兄。分层分析的 logisitc回归sas应该如何编程呢?用by语句就可以。多谢!我先试试在大样本的情况下,作logistic逐步回归,常会出现偏回归系数的检验有意义(p值接近界值),OR值的95%的可信区间包含1,这种情况下该如何调整呢?结论该如何下(该依据谁)fyzzz兄,请指教。该怎么办呢goodman5160 wrote:在大样本的情况下,作logistic逐步回归,常会出现偏回归系数的检验有意义(p值接近界值),OR值的95%的可信区间包含1,这种情况下该如何调整呢?结论该如何下(该依据谁)一种可能是:这反映的是事实。这样的话,无论如何调整,都无法改变这种状态。文字上可以直接表明这种P值,或者区间值和相应的显著性水平。相应的任何说法都要慎重。至于“该依据谁”,不应该是问题,因为”p值接近界值“
与 “OR值的95%的可信区间包含1” 有时候是数值四舍五入的数学原因造成的,二者不存在冲突。另一种可能:连续型变量直接进入模型也有可能出现这种状况。对这种情况,可以尝试: 1)将连续型数据转为分类型数据;2)在SAS中使用unit语句,就是改变连续型数据的“单位”差距。fyzzz wrote:一种可能是:这反映的是事实。这样的话,无论如何调整,都无法改变这种状态。文字上可以直接表明这种P值,或者区间值和相应的显著性水平。相应的任何说法都要慎重。至于“该依据谁”,不应该是问题,因为”p值接近界值“
与 “OR值的95%的可信区间包含1” 有时候是数值四舍五入的数学原因造成的,二者不存在冲突。另一种可能:连续型变量直接进入模型也有可能出现这种状况。对这种情况,可以尝试: 1)将连续型数据转为分类型数据;2)在SAS中使用unit语句,就是改变连续型数据的“单位”差距。我想我遇到应是第一种情况,因为我以将资料中的连续型变量变为了多分类,结果依然出现了这种情况。至于该依据谁我还是有些不明白。虽然P接近界值但是仍然是小于界值 的,如果按界值标准下结论,(假定偏回归系数为正)我依然可以认为其为危险因素,是不是可以不考虑OR值95%的可信区间包含1呢?请问各位老师:我做死亡危险因素时,单因素分析找到六个变量有意义(T检验\卡方检验),再用SPSS做LOGISTIC回归,(按照马斌荣老师出的教材方法去做),出来的方程就没有意义,而且所有变量P值均接近1,但我随便用两个变量(其中一个是单因素有意义,一个单因素无意义)做LOGISTIC回归,方程及变量均有意义,但拟合度只有63%,如何解释?我该怎么办????
您的位置: &&【图文】Logistic回归分析及应用_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
Logistic回归分析及应用
上传于||暂无简介
大小:1.76MB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢虚拟变量与logistic回归练习题_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
虚拟变量与logistic回归练习题
上传于||文档简介
&&S​P​S​S​中​虚​拟​变​量​与​l​o​g​i​s​i​c​练​习
阅读已结束,如果下载本文需要使用1下载券
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,查找使用更方便
还剩5页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢logistic回归影响因素显著水平如何计算_百度知道

我要回帖

更多关于 logistic回归分析 的文章

 

随机推荐