如何比较3组数据挖掘 统计学间是否存在统计学差异?

本文源自“辑文编译”网站,小编对部分表述进行了修订。很多人对于SCI论文的撰写,都需要通过一定数量临床病例(或资料)的观察,研究事物间的相互关系,以探讨客观存在的新规律。如确定新诊断、新治疗等措施是否优于原沿用的方法,就需进行两种方法比较,这就涉及统计处理;统计设计又是整个课题研究设计中一个重要的组成部分。显然,经正确统计处理的结果可信度高,而且SCI论文的质量也高。现就SCI论文文稿中常见的统计问题及其相应的处理方法简述如下。一、常用的统计术语统计学中常用的概念有总体与样本、随机化与概率、计量与计数、等级资料及正态与偏态分布资料、标准差与标准误等。如某研究采用经会阴途径测定宫颈长度,以探讨不同宫颈长度与临产时间的关系。结果显示35例宫颈长度为25~34mm者与32例宫颈长为15~24mm者临产时间的均值±标准差(x±s)各为57.6±58.1与47.3±49.1小时。该计量资料,经t检验显示t=0.780,P&0.05,并未提示不同宫颈长度的临产时间差异有统计学意义;从标准差大于均值,显示各变量值离散程度大,呈偏态分布,故不能采用x±s这一算术均数法计算均数。经偏态转换成近似正态分布资料后结果是:35例与32例的临产时间各为34.5±4.1与26.7±4.1小时,(t=7.778,P&0.001),两组差异有统计学意义。可认为随着宫颈长度的缩短、临产时间也缩短。此外,当两组资料单位不同时,其s单位也不同;即使两组单位相同的变量值,若其均数差异较大,也都应以变异系数替代s来比较两组值的离散度的大小。二、正常值范围及异常阈值的确定如何选择研究对象,至少需多少例,正确统计处理和参考一定数量的病例数据,是确定正常值范围及异常阈值的四个重要因素。1.研究对象:应为“完全健康者”,可包括患有不影响待测指标疾病的患者。如“正常妊娠”的条件:孕前月经周期规则、单胎、妊娠过程顺利、无产科并发症及其它有关合并症,分娩孕周为37~41周+6,新生儿出生体重为2500~4000g和Apgar评分≥7分。2.观察数量:观察数量应尽可能多于100例;需分组者,各组人数也是如此(标本来源困难时酌情减少)。有些指标值如雌三醇(E3)、甲胎蛋白(AFP)、胎盘泌乳素(HPL)等随孕周进展而变化,应按孕周分组;邻近孕周均数相近者,可合并几周计算。若为偏态分布,应以百分位数计算,则例数应≥120例。取各孕周对象时,应考虑到所取各孕周中的例数分布大致均衡。显然,文稿中往往以少量例数求得正常值是欠可靠的。3.统计处理:应根据所得数据分布特征采用不同的统计处理方法。属正态或近似正态分布的数据,可采用x±s法计算;这也适用于以一定方法能将非正态分布转换成正态或近似正态分布的资料。对无法转换的偏态资料,应采用百分位数计算法。具体计算(包括上下限初步制定)见文献。4.对照数量:相应观察的病例数(包括分组)应不少于30例,这对制定某指标有临床意义的异常阈值尤其重要,这一点往往易被忽视。如在参考较多病例数据后,唾液游离E3的下限异常阈值应为第2.5百分位数,而非通常采用的5百分位数。否则,将会导致该指标产前监护的假阳性率增加。三、t检验与校正t检验(t′检验)这是SCI论文文稿中极易混淆的一类计量资料统计问题。(一)检验的注意事项1.t检验的意义:t检验与所有统计分析相同,其结果提示现有差别不仅仅是抽样误差所致,且提示犯第一类错误的可能性大小,即t0.05与t0.01犯第一类错误的可能性各为5%与1%。2.统计学意义与临床意义的关系:有统计学意义,而在临床上可能是无意义的,提示该研究应继续深入,以明确该差异是否真有统计学意义;相反,无统计学意义,而临床上却是有意义的,不能贸然轻易地下结论。应复查实验设计、方法、试剂及仪器性能、质控措施和实验数据等是否有问题,或尚需再进一步增加样本量进行复测等。3.t检验适用范围:t检验仅适用于正态或近似正态分布(包括偏态转换)和其方差是齐性资料的检验;t检验适用于可比性资料,即除了欲比较的因素外,其它所有可影响的因素应相似。4.t检验的结果判断:判断结果不应绝对化,P&或&0.05,分别表示可拒绝或接受原定的假设,但两者都有5%的可能性犯第一类错误;而P值越小,只能是更有理由拒绝原定的假设。5.单侧与双侧检验:应预先制定本研究的结果是需行双侧还是单侧检验。对有把握确知某治疗措施或某指标是不会劣于现有的,才作单侧检验;若不知何者为优,应行双侧检验。因为在同一t值的界限上,单侧检验的概率(P)仅为后者的一半,也就是说单侧检验较双侧检验更易得出差别有统计学意义的结论,不可随意制定。一般讲,绝大多数研究以采用双侧检验为妥。(二)t′检验与t检验的区别  当两样本均数的方差不齐时,应以t′替代t检验。例如:甲组32例血清某指标值为53.9±49.6(μmol/L);乙组6例的结果为26.6±7.2(μmol/L),若不考虑两样本方差大小,t检验示t=1.331,P&0.05,提示两组血清该指标的平均含量差异无统计学意义。但先作方差齐性检验,F=47.4,P&0.01,示这两样本方差不齐。据此应采用t′检验,t′=2.952&t′0.012.875,P&0.01。显然,与上述结论恰恰相反。四、卡方(χ2)、校正χ2与直接概率法(或精确法)检验这三种检验方法为一类用途较广、但也易混淆的、适用于计数资料检验的方法。应注意,鉴于总数与理论值的不同,应采用相适合的检验方法。例1.192例出生体重≥4000g的新生儿发生难产与窒息数分别为151例与22例;3475例出生体重≥3500~4000g的新生儿发生难产与窒息数分别为185与265例;2451例出生体重≥2500~3500g的新生儿发生难产与窒息数分别为122与169例。3组的构成比:难产与新生儿窒息率分别为:78.6%、5.3%、5.0%与11.4%、7.6%、6.9%。据此贸然认为出生体重≥2500~3500g为最佳新生儿分娩体重的结论是不可靠的。经χ2分析,后两组的难产与窒息率间和前两组窒息率间差异均无统计学意义(P均&0.05)。故可认为,单据本研究结果是难以得出上述临床上认可的结论的。这涉及到上述“无统计学意义,而临床却是有意义”的问题,应进一步复查或增加样本测试。杜绝单纯根据百分率的大小贸然下结论。例2.某药治疗感染衣原体(CT)的中、晚期孕妇各11例和36例,她们的新生儿感染CT数各为3例和23例。χ2检验得χ2=4.570,P&0.05。据此误认为,某药治疗中孕期感染CT孕妇的新生儿感染CT数少于晚孕期才开始治疗的新生儿感染数。根据统计原则,其中一个数的理论值为4.9(&5)时,应采用校正χ2计算,得χ2=3.209,P&0.05。显然,正确结论恰与上述相异。例3.以精确法替代χ2检验。某新技术测试8例卵巢内胚窦瘤患者,5例呈阳性反应;测试25例卵巢颗粒细胞瘤患者中6例阳性。χ2检验得χ2=4.042,P&0.05。误认为该新技术测前组的阳性率高于后组。但鉴于总例数33例(&40),且其中一个数的理论值为2.7(&5),故应改用精确法检验,结果首次计算P值,已达0.102,&双侧检验的有统计学意义的界限0.025,故P&0.05。结论也恰相反。五、相关与回归分析相关分析只是以相关系数(r)来表示两个变量间直线关系的密切程度和相关方面的统计指标。无论是正相关(r为正值)或负相关(r为负值),只是经相关系数的统计学意义检验(如t检验)后,当P&0.05时,即示差异有统计学意义时,才能依据|r|值的大小来说明两变量间相关的密切程度。因此,表示相关性,除写出r值外,应注明P值;切不可将相关的显著性误解为相关程度;也应注意:相关分析是不能单纯用于阐明两事物或现象间存在着本质的联系,即使两变量间存在高度相关关系(即有一定的统计联系),也不能证明它们间存在着因果关系。如欲证明两事物间的内在联系,必需凭借专业知识从理论上加以阐明。“相关”是表示两个变量间相互关系的密切程度,而回归分析是提示两个变量间的从属关系。在回归分析中,应注意由X变量值推算Y,与以Y变量值推算X的回归线是不一样的;直线回归方程的适用范围,一般仅适合于自变量X原测数据的范围,故绘制回归线时,X值切不能超越实测值的范围而任意延长。可见,这两种分析,说明的问题是不同的,但相互又有联系。在作回归分析时,一般先作相关分析,只有在相关分析有统计学意义(即回归有统计学意义)的前提下,求回归方程和回归线才有实际意义。决不能把毫无实际意义的两个事物或两种现象进行相关与回归分析。六、数据的正确书写1.文稿内各数据的书写必须前后一致;总数应等于各分组的数据之和。2.对不同指标,有其不同数据精度的要求,这应结合专业知识加以判断。如新生儿出生体重是以公斤为单位, 记录测定数据精确到小数点后的第二位数字即可。3.测定数据的书写,不能超越其测量仪器测试的精确度范围。4.同一指标的前后数据应保持同一精确度。5.经计算,出现比预定小数点后两位数多的数字,应采取“≤4舍、≥6入”与“5‘奇’进‘偶’出”方法,以决定小数点后第三位数字是“舍”还是“入”,即5前为单数则入,双数则舍。6.未经统计检验,文稿内不宜出现推断性的比较结果的结论。如“××结果的百分率高或低于××结果的百分率”、“本文结果较××报道的多或少或类似”等结论。这在综述类文章撰写过程中也需注意;欲予以比较,也应注意两者的可比性。上述是统计学中较为基础的概念,但又是SCI论文文稿中常见的、较易出现差错的内容。因此可以认为,统计学是医护人员必需掌握并能熟练应用的一门重要知识;藉此,可不断地从自身和他人的研究中获取更多、更新和更可靠的专业信息。关注“一起学SPSS”后,回复“电子书”或“book”可获取本书配套免费电子书及数据文件下载地址。回复“key”可获取订阅号文章目录。邮箱:共享网盘:/s/1bnDDh2R医学统计交流请加“一起学SPSS小编”微信。 
 文章为作者独立观点,不代表微头条立场
的最新文章
单样本等价检验(1-Sample Equivalence Test)用于评估某一产品或过程的均值和目标值间的在广州上学的大学生可能都听说过描述广州各大高校学生特点的段子,其中有一句是“中山医书呆子”,然而,中山医的学生小号曾做过横断面调查,关注本号的朋友有六成是医务工作者、有六成是硕士以上学历,为此小编深感荣幸、沾黑夜的眼是什么颜色?
是狼的眼睛,坚定而冰冷?
我来到校园,
校园仍然娴静而美丽,
回答着我的疑问……
白玉单样本等效检验(1-Sample Equivalence Test)用于评估某一产品或过程的均值和目标值间的等效检验(equivalence test)又称等价检验,可用于确定产品测量或过程测量的均值的接近程度是否足单样本Z检验(1-sample Z-test)用于检验总体标准差σ已知的资料的总体均值μ是否等于目标值,并可单样本Z检验(1-sample Z-test)用于检验总体标准差σ已知的资料的总体均值μ是否等于目标值,并可内容摘自本订阅号主编的《SPSS常用统计分析教程(SPSS 22.0中英文版)(第4版)3.3.1比较数据集【编者注】本号为中山医人创办,愿成为校友们的民间交流平台,在周末不定期刊发校友们的文章。校园风光,故人相聚,图形化汇总功能可生成4种图形:带正态曲线的数据直方图(histogram of data with an o【网友咨询】李老师,有个问题 想问你。 T检验中,配对要录两列值!两独立样本要录一列值 一列分组! 这有原因
“亲爱的,快来学校集中,我们在孙中山像下汇合,校庆聚会7点半就开始了。”我按下手机,揉揉发酸的眼角,脱存储描述性统计量功能和显示描述性统计量功能一样,也可以计算一个以上的变量的描述性统计量,或按分组变量计算一个《【SPSS】率的两两比较(Bonferroni校正)》一文介绍了率的两两比较的Bonferroni校正,但使用SPSS统计软件包对L9(34) 正交试验结果进行数据处理, 只要按正交表的设计格式输入实验数据, 便可获得所需的统计结果。其操作方便,直观,快捷,结果准确,使研究工作事半功倍,此法也可用来处理其他正交试验的数据。显示描述性统计量(DisplayDescriptive Statistics)可以计算一个变量或多个变量的描文章写于2009年6月,原作者要求署名:中山医人。尘封的记忆,逝去的年华,匆匆而不留一丝痕迹; 青涩的青春,广州地铁上有一个公益广告,说的是童心、信用、孝敬等,其中就出现了童心路、执信南路和光孝路。 执信南路无非就广在广州上学的大学生可能都听说过描述广州各大高校学生特点的段子,其中有一句是“中山医书呆子”,然而,中山医的学生——在老中山医人的心目中,只有中山医,永远的中山医,她今年149岁,我们的大师兄是中山先生……公卫14级硕士 梁健君摄【编者注】昨天的两篇文章,风魔校友圈,校友们纷纷发来鼓励、点赞,勾起了校友们的思校情燕京啤酒(曲阜三孔)有限责任公司质检部
273100【编者注】昨天的两篇文章,风魔校友圈,校友们纷纷发来鼓励、点赞,勾起了校友们的思校情怀,很多校友都发来文章。本号愿成为校友们的民间交流平台,每个周末刊发校友们的文章。校园风光,故人相聚,尘封记忆,一切跟"中山医"有关的……资料源自于网络昨天的事情骚扰大家了,非常抱歉!今天笑一下吧。 1、一名统计学家遇到一位数学家,统计学家调侃数《Bonferroni:Step by Step 攻克两两比较》一文谈及“Bonferroni提出,若每次检建立数据文件是统计分析的基础步骤,建立一个理想的数据文件,对于后续的数据预处理(数据整理、变换)、统计分析、1、没有女朋友;2、没有车。回答:两者都中。哈哈,看了下面这些神一样的统计学,你绝对会举双手双脚赞同。怎么每个都好像那么准呢?一起来看看你中招了吗?【网友咨询】现在已有组整理成频数表的数据(如下图),应该如何录入SPSS和统计分析呢?【解答】这是一组整理好【来源于网络】1、曾经有一个学统计的学生,他开车的时候,总是在十字路口加速,呼啸而过,然后再减速。一天他带着上篇写到养在深闺人难识:功能强大的Minitab,人如其名,Minitab的确是一位年芳二八(V17.0)楚小伙伴如果觉得用广义线性模型的这把牛刀计算率的95%CI太浪费了,也太麻烦,那么在这里推荐一把杀鸡刀给您——“一起学SPSS”的联盟订阅号“医学统计精粹”曾介绍过用比率分析进行率及其95%可信区间的计算。今天给大家介内容摘自《SPSS常用统计分析教程(SPSS 22.0中英文版)(第4版)》3.2.5加权个案加权个案(We●Minitab?迷你表格?○不,她是一款质量管理统计。●SPSS、SAS,还有现在很火的R就听多了,Min来源|腾讯全球合作伙伴大会在最近举办的2015腾讯全球合作伙伴大会[互联网+微信]的分论坛上,微信官方第一次内容摘自《SPSS常用统计分析教程(SPSS 22.0中英文版)(第4版)》3.2.4选择个案读者可按指定准网友们在阅读SIC或其他文献时,可能会发现Bonferroni是在研究中涉及多重比较时出现较多的一个高频词,转自微信订阅号“视觉志”这是我的博士同事,Naphet,10月20日下午3点,他正式打出了他的博士论文,完成转自微信订阅号“spss统计分析”本文给大家推荐几个非常优秀的统计学在线课程,都是出自名校和名师之手。微信公【历史文章查询方法】回复关键词即可查到相应的文章。注:获取本文方法,回复关键词“文章”或“art”,或选择菜“一起学SPSS”是以介绍SPSS使用技巧为基础,并介绍各类统计及数据管理工具的使用技巧及统计学知识的微信订关注“一起学SPSS”后,回复“电子书”或“book”可获取《SPSS常用统计分析教程(SPSS 22.0中英文版)(第4版)》配套免费电子书及数据文件下载地址。lizh_SPSS本订阅号由《SPSS常用统计分析教程(第4版 22.0中英文版)》(电子工业出版社2015年8月待出版)编委会创办,欢迎提出问题、建议、命题作文、提供实例素材以及投稿,将不定期推送使用技巧文章,敬请留意!热门文章最新文章lizh_SPSS本订阅号由《SPSS常用统计分析教程(第4版 22.0中英文版)》(电子工业出版社2015年8月待出版)编委会创办,欢迎提出问题、建议、命题作文、提供实例素材以及投稿,将不定期推送使用技巧文章,敬请留意!丁香园App是丁香园社区的官方应用,聚合了丁香园论坛和丁香客的精彩内容。医生可通过丁香园App浏览论坛,也可以在这个医生群集的关系网络中分享和互动,建立更广泛的学术圈子。
扫描二维码下载
今日:0 | 主题:82109
每发1个新帖可以获得0.5个丁当奖励
【求助】请教各位老师,三组数据有统计学差异,怎么两两比较?
楼层直达:
如题,三组临床数据,用K-W检验有统计学差异,如何进行两两比较,寻找差异组?软件如SAS。谢谢各位。
分享到哪里?
SPSS有K W检验的两两比较程序
分享到哪里?
sx子木 SPSS有K W检验的两两比较程序 我剩下的三个组都是二分类变量,三种药,治疗的有效与无效,这三个组比较,P小于0.05,如何再进行两两比较?谢谢!
分享到哪里?
我剩下的三个组都是二分类变量,三种药,治疗的有效与无效,这三个组比较,P小于0.05,如何再进行两两比较?谢谢! 二分类变量用K-W检验干嘛啊
分享到哪里?
二分类变量用K-W检验干嘛啊之前的其他组的计数资料不符合正态分布,是用的k-w检验。现在的问题是,有三种药,比较治疗效果,有效,无效,然后三组有差异,怎么两两比较?
分享到哪里?
计数资料哪还有什么正态分布啊?先不管那个,你现在这个可以对P值进行校正
分享到哪里?
可以用卡方检验吧,如果有差异再进行两两比较
分享到哪里?
关于丁香园下面题目如何利用卡方检验判断两组数据比较差异有无统计学意义?.请大家帮忙_已解决 - 阿里巴巴生意经
大家都在搜
下面题目如何利用卡方检验判断两组数据比较差异有无统计学意义?.请大家帮忙
banggongjss的答复:
秩和检验就行
回答:共&0&条苹果/安卓/wp
苹果/安卓/wp
积分 118, 距离下一级还需 27 积分
权限: 自定义头衔
道具: 彩虹炫, 雷达卡, 热点灯, 雷鸣之声, 涂鸦板, 金钱卡, 显身卡下一级可获得
道具: 匿名卡
购买后可立即获得
权限: 隐身
道具: 金钱卡, 雷鸣之声, 彩虹炫, 雷达卡, 涂鸦板, 热点灯
开心签到天数: 1 天连续签到: 1 天[LV.1]初来乍到
有三组数据,每组有4个值,如何进行三组的统计学差异检验?
A& && &B& && &&&C
2.2& & 2.3& &&&2.5
2.1& & 2.5& &&&2.5
2.5& & 2.4& &&&2.3
2.3& & 2.1& &&&2.1
可否进行方差分析?感觉数据量是否不够。如不行,怎么进行三组间的统计学差异检验?请求各位指导,多谢!
载入中......
你的原假设是什么?
或者是你要检验什么?
我的微博:
欢迎互相加关注!
本帖最后由 sushe1527 于
09:49 编辑
Means with the same letter are not significantly different
do i=1 to 4;do j=1 to 3;input x@@;
2.2& & 2.3& &&&2.5
2.1& & 2.5& &&&2.5
2.5& & 2.4& &&&2.3
2.3& & 2.1& &&&2.1
model x=j;
有几个问题
1.正态分布
先把这几个问题解决了再做吧
初级热心勋章
初级热心勋章
中级热心勋章
中级热心勋章
初级学术勋章
初级学术勋章
初级信用勋章
初级信用勋章
论坛好贴推荐
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
为做大做强论坛,本站接受风险投资商咨询,请联系(010-)
邮箱:service@pinggu.org
合作咨询电话:(010)
广告合作电话:(刘老师)
投诉电话:(010)
不良信息处理电话:(010)
京ICP证090565号
京公网安备号
论坛法律顾问:王进律师

我要回帖

更多关于 数据挖掘 统计学 的文章

 

随机推荐