我也在做描述性分析,按照你的说方法一步一步的操作的,为什么均值和均值标准差公式会出现省略号呢?最大最小正常

苹果/安卓/wp
积分 13179, 距离下一级还需 5121 积分
权限: 自定义头衔, 签名中使用图片, 设置帖子权限, 隐身, 设置回复可见, 签名中使用代码
道具: 彩虹炫, 雷达卡, 热点灯, 雷鸣之声, 涂鸦板, 金钱卡, 显身卡, 匿名卡, 抢沙发, 提升卡, 沉默卡, 千斤顶, 变色卡下一级可获得
道具: 置顶卡
购买后可立即获得
权限: 隐身
道具: 金钱卡, 雷鸣之声, 彩虹炫, 雷达卡, 涂鸦板, 热点灯
TA的文库&&
开心签到天数: 604 天连续签到: 99 天[LV.9]以坛为家II
本帖最后由 xddlovejiao1314 于
09:15 编辑
描述性统计分析在实证研究中的作用及具体软件实现——以SPSS为例& & &&
为了提升经管代码库(http://bbs.pinggu.org/forum-2626-1.html)人气,一大早起床,打算就微观实证分析中描述性统计分析作用及SPSS具体软件实现做个详细的说明,理由如下:& &&&一是有坛友在论坛上问:看到很多实证研究在建模前有做描述性统计分析,问做这个有何意义(网址链接:http://bbs.pinggu.org/thread--1.html),说明有实际需求;二是论坛上也没看见有什么详细阐述这个问题的,说明有实际需求而无有效供给。故而特开此贴,希望能吸引更多对计量实证感兴趣的朋友关注经管代码库,来多多发此类原创帖。不多说,图文并茂的开讲啦!& &&&做用SPSS具体做描述性统计分析前,先简要说一下我个人认为的在实证分析中做描述性统计分析的作用——探究数据分布趋势,找出极端异常值。由于此贴只讲描述性统计分析,故而不对极端异常值对模型的影响,数据分布趋势不是正态进一步详尽处理展开来说,只点到即止,后续帖子陆续补充。& & 在用SPSS做描述性统计分析前,先截两张实证论文中一般做的描述性统计分析表格。进而可以直观看到我们一般做描述性统计分析要交待哪些统计量。
19:29:59 上传
& && &&& 以上两个表格是常见的描述性统计分析表述表格,一般实证论文中,做描述性统计分析要报告以下4个统计量:均值、标准差、最小值和最大值(有的文章限于表格篇幅,只报道均值和标准差)。问题来了,做了描述性统计分析后,结果要怎么看呢?我们要怎么才能确认结果是好或者不好呢(即变量是否符合正态分布呢)?& && && &这个问题一般看均值和标准差。如果标准差&&均值,那表明数据可能存在极端异常值,这时可能要对数据做进一步的处理。如做箱形图看是否存在极端异常值(头上标*的就是)。然而,一般情况下如果均值和标准差相差不大,如上表中“1998—2003年年均调整地块百分比”这类变量,可以就这样,不用做进一步处理。若存在极端异常值,参见我这篇帖子的处理方法:。& && && &下面用SPSS截图演示怎么做描述性统计分析吧(案例用的SPSS自带文件accidents.sav)。软件操作:分析——描述统计——描述
19:33:01 上传
& && && &得到如下结果:这时平均值&&标准偏差,说明数据离散程度不高,可以进一步进行后面的建模分析。
19:33:51 上传
& && &为了看看变量的趋势,我们再做一个直方图,附加正态分布曲线看看。软件操作:图形—图表构建器(弹出对话框,点确认)—选择直方图(直接将下面的图形拖动到图表预览窗口即可),选择“风险人口”变量到X轴,右边勾选“显示正态曲线”。
19:35:04 上传
& && & &&如果还不放心,做一个箱图看看是否存在极端异常值。软件操作:图形—图表构建器(弹出对话框,点确认)—选择箱图。这时,“风险人口”这种连续变量放纵坐标,性别等类别变量放横坐标(前提是你想看不同性别风险人口是否存在极端异常值,若只想看变量总体的分布是否存在极端异常值,则只将关心的连续变量拖到纵坐标框即可,横坐标不用管,然后点确定)。我们这里只看总体吧。& && && &看结果,上面没有“*”出现,表明不存在极端异常值。可对数据进一步做建模处理。
19:36:16 上传
& && && &分界点:下面我们人为的改变一下原始数据大小,使其出现两个极端异常值(极大值和极小值),看看情况。我们把原始数据人口第一行从198522改为10000,第6行208239改为1000000。然后再重复前面的描述性统计分析过程。
19:37:21 上传
& && &&& 由上表可知,标准偏差&平均值的(但可能是否远远大于不好判断,因为原始数据量就只有6个,比较少)。这时我们持保留态度。看箱图。软件操作:图形—图表构建器(弹出对话框,点确认)—选择箱图。
19:38:14 上传
& && &&& 这时,我们看到这个箱形图的上下方各有一个“*”,表明存在极端异常值。接下来就是对极端异常值的处理了。限于篇幅,本篇描述性统计分析介绍就到这里,下一篇是极端异常值的诊断和处理。请期待经管代码库的下篇解说,谢谢。
支持楼主:、
购买后,论坛将奖励 10 元论坛资金给楼主,以表示您对TA发好贴的支持
载入中......
(229.33 KB)
19:29:06 上传
19:41:42 上传
描述性统计分析在实证分析中的作用及SPSS软件实现
发表于197楼
描述性统计在论文写作中有很重要的作用,不仅是后面模型实证部分的先导,而且实证模型的选择有时也需要描述统计做铺垫。有的时候不注重描述性统计,但是好论文,还是需要在描述性统计上下功夫的~支持楼主啦~
发表于170楼
感谢楼主,讲解的相当清晰。目前正在努力学习SPSS中,争取能够在毕业论文中用到楼主所阐释的方法。祝楼主科研学术顺利成功!
发表于143楼
感谢楼主分享,非常实用
发表于130楼
楼主辛苦了,非常实用,spss相较于SAS灵活性虽差了一点,却简单实用
发表于131楼
非常喜欢楼主的原创帖子,学习的好资料,受益匪浅,谢谢分享,辛苦了。
发表于129楼
谢谢露珠~我们在碰到极端值的时候通常是找出极端值、解释原因、然后带着极端值建模的,毕竟在有大量数据的情况下极端值对模型的影响并没有想象中的大。
发表于122楼
非常赞,实际运用里包括系统元数据管理\\数据质量管理\\数据探索等,描述性统计都起到了至关重要的作用
发表于102楼
谢谢您的分享,学习中会遇到很多问题,计量经济学入门一直比较头疼,没有毅力坚持学下来,因为总是不能完全学懂。
发表于90楼
非常好的文章,多多益善。
发表于80楼
很有启发性,一上午连续性地读了好几个帖子,不错。。谢谢
发表于72楼
很好,支持一下。楼主对spss软件的应用已经”出神入化“,可以办个暑期培训班了。
另外,楼主昨天邀我参加”经济实证如何选题“的讨论,我也乐意参加,但是链接打不开,系统提示是:”抱歉,指定的主题不存在或已被删除或正在被审核!“不知是哪里出问题了。
发表于61楼
很好的文档,谢谢提供
发表于42楼
确实很好楼主,感谢提供。大家都没在意用处,这下可以好好学习了
发表于20楼
呵呵,软件始终是工具,知道原理更重要。SPSS之所以受众那么高就在于其界面化的操作吧。不用写代码。
发表于13楼
作为一个初学者觉得特别好,一下就听懂了。希望楼主以后多更新哦~会跟进学习的~
发表于119楼
嗯,很多做应用计量的都是拿到数据后确定x和y就匆忙的建模了,忽略了基础数据的清洗工作。论坛看似有很多很好的资料的分享(如各种高大上版本的外文计量统计教材),但中国现在的学术环境是比较急功近利的,对于初入学术圈的学生来说,可能少有人会去认真阅读这些书籍。同时,一些实证研究中需要注意的小细节(如数据清洗工作怎么处理)很多书上是没写的,都是大家慢慢摸索或是有人在前方指导才会明白的。我自己也想多分享一 ...
发表于117楼
其实论坛内太需要你这样的楼主,在一些基础层面的东西给新手以必要的解释,这会给无数新手一个好的引导。一个模型复杂与否并不重要,重要的是学的人和看的人能顺利的给予理解,希望楼主能给新人多多提供一些基础方面的解释。
发表于50楼
太好了,永久珍藏
发表于28楼
谢谢楼主,很好,学习了
发表于27楼
感谢,很有用!
发表于26楼
讲得很好,来此学习学习。
发表于11楼
铁肩担道义,妙笔著文章。
不错,鼓励一下!
总评分:&经验 + 780&
论坛币 + 296&
学术水平 + 32&
热心指数 + 36&
信用等级 + 25&
本帖被以下文库推荐
& |主题: 406, 订阅: 13
说话是一种能力,少说是一种智慧
没人,我自己顶一个。
总评分:&论坛币 + 10&
学术水平 + 1&
热心指数 + 2&
信用等级 + 1&
不错,鼓励一下!
鼓励积极发帖讨论
总评分:&经验 + 10&
论坛币 + 5&
热心指数 + 1&
gxnnhgm66 发表于
不错,鼓励一下!谢谢鼓励。
总评分:&经验 + 50&
论坛币 + 10&
学术水平 + 5&
热心指数 + 6&
信用等级 + 5&
鼓励积极发帖讨论
总评分:&经验 + 30&
论坛币 + 5&
学术水平 + 1&
热心指数 + 1&
信用等级 + 1&
本帖最后由 xddlovejiao1314 于
09:02 编辑 yangzewen 发表于
很好很好哈哈~
总评分:&论坛币 + 10&
热心指数 + 1&
感谢楼主 顶
鼓励积极发帖讨论
总评分:&经验 + 30&
论坛币 + 3&
热心指数 + 1&
magicyaokeda 发表于
感谢楼主 顶谢谢,对你有用就好哦。
总评分:&论坛币 + 10&
热心指数 + 1&
Ψ▄┳一大卫卍卐席尔瓦
xddlovejiao1314 发表于
谢谢,对你有用就好哦。谢谢斑竹分享
愿你在学术道路上更上一层楼
帮俺审核下帖子咯
总评分:&经验 + 100&
论坛币 + 10&
学术水平 + 10&
热心指数 + 10&
信用等级 + 10&
fantuanxiaot 发表于
谢谢斑竹分享
愿你在学术道路上更上一层楼审核不了呢?
观点有启发
总评分:&论坛币 + 10&
热心指数 + 1&
一级伯乐勋章
一级伯乐勋章
初级学术勋章
初级学术勋章
初级热心勋章
初级热心勋章
初级信用勋章
初级信用勋章
中级热心勋章
中级热心勋章
中级学术勋章
中级学术勋章
中级信用勋章
中级信用勋章
高级热心勋章
高级热心勋章
高级学术勋章
高级学术勋章
高级信用勋章
高级信用勋章
特级热心勋章
高级热心勋章
特级学术勋章
特级学术勋章
特级信用勋章
高级信用勋章
论坛好贴推荐
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向,请联系(010-);
邮箱:service@pinggu.org
投诉或不良信息处理:(010-)
京ICP证090565号
京公网安备号
论坛法律顾问:王进律师SPSS基本操作和描述性分析_图文_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
SPSS基本操作和描述性分析
上传于||文档简介
&&S​P​S​S​基​本​操​作​和​描​述​性​分​析
大小:774.50KB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢【图文】上机课第2讲 描述性统计_1_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
上机课第2讲 描述性统计_1
上传于||暂无简介
大小:1.17MB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢小胖说统计之临床试验中的描述性统计分析
小胖说统计之临床试验中的描述性统计分析
The purpose of
the field of statistics is to characterize a population based on
the information contained in a sample taken from that
population。
上述论述中,包含的三个要素是population、samples和characterization。那么具体怎么characterization呢?无非有两种,一种就是我们所谓的descriptive
statistics(描述性统计分析),一种是inferential statistics(推断性统计分析)。
具体到我们的临床试验中,描述性统计分析占到了我们最后统计分析报告的绝大部分,这是因为除了你事先有检验假设的一些终点的分析会用到推断性统计分析外,你几乎所有的人口学和基线变量的总结、疗效数据的总结、安全性数据的总结都要用到描述性统计分析。
而具体的描述性统计分析,又根据不同的数据类型有不同的描述方式,对于连续性变量来说,我们最常用到的是均数、标准差、中位数、最小值和最大值;对于分类型变量来说,主要用到的是频数表的方式即频数及百分比;对于time to event数据来说,我们则最主要基于Kaplan-Meier来进行统计描述。
此外,除了用表格的形式对临床试验数据进行描述性总结之外,我们还会用到一些figures来进行统计描述,最常见的如Line Plot,Bar Chart,Box Plot,K-M curve等。
我们在统计分析计划或研究方案中的统计分析部分,特别是在统计分析的一般原则中一般会对描述性统计分析常有以下类似的描述:
对于连续型变量,将列出未缺失的受试者个数、均数、标准差、中位数、最小值和最大值。对于分类变量,将以频数表的形式(频数和百分数)列出。
而有些比较详细的统计分析计划会对各描述性统计分析统计量的小数位数加以规定,从而使更加标准化,当然小数位数的规定也不是绝对统一的标准,以下的例子的描述供大家参考:
对于连续型变量,将列出未缺失的受试者个数、均数、标准差、中位数、最小值和最大值。最小值和最大值的小数位数将与数据库中记录的原始数据保持一致。均数、中位数和标准差将比数据库中记录的原始数据多保留一位小数,但最多不超过四位小数。对于分类变量,将以频数表的形式(频数和百分数)列出。百分数将保留一位小数。
正如上文提到的,描述性统计分析贯穿于临床试验统计分析的始终,这一点很容易理解,统计分析的最基本最重要的是,首先你必须准确地对数据本身以及对数据的分布有一个清楚的描述和总结,即使你通过各种检验方法甚至统计模型来进行统计推断和比较,但在这一步之前,你需要对你进行统计推断和比较的数据进行一个描述性总结,列出治疗各组之间的均值、标准差之类的或者频数、百分比之类的统计量,然后再采用适当的统计推断检验方法进行组间的比较。因此,从这个意义上,我们就不难理解我们一般把对描述性统计方法的描述放在统计分析的一般原则中。
一份完整的统计分析计划的统计分析方法部分一般可以分为三部分:受试者情况、疗效分析和安全性分析,我们来看一下描述性统计分析是怎么在统计分析计划的各项内容中加以体现的:
1受试者情况
(1)受试者分布:
在这部分中,我们往往会对入组人数、随机化人数、完成试验的人数以及未完成试验的人数,甚至参加各个访视的人数加以总结。另外,我们会对未完成试验的受试者的原因进行总结。所有这些总结都会用到频数和百分比等描述性统计分析方法。
(2)方案违背:
在这部分中,我们会对受试者的方案违背进行分类总结,显然频数和百分比是必须用到的。
(3)人口学和其他基线数据
在这部分中,将对人口学和其他基线数据进行汇总。其中连续型变量如年龄(岁)、身高(cm)、体重(kg)和BMI(kg/m2)等会列出均值、标准差、中位数、最小值和最大值等描述性统计,而对分类型变量如性别、民族等会用到频数和百分比。&
(4)治疗依从性
在这部分中,我们首先会对治疗依从性加以描述性总结,当然列出的是均值、标准差、中位数、最小值和最大值等,然后我们还会根据治疗依从性不同的level(如&80%, 80-90%.
&=90%等)来进行分类总结。
(5)合并用药
在这部分中,合并用药一般会根据WHO-Drug或类似的dictionary进行编码,然后根据ATC level
decode进行频数表分类总结。
疗效分析一般是临床试验最核心的部分,因为大部分临床试验的主要目的或者说主要的检验假设都是建立在疗效分析的基础上。但即便是这样,在你对主要疗效或次要疗效终点进行统计检验前,必须首先对它进行一个最基本的描述吧。
在连续性变量方面,临床试验中现在最常见的疗效终点莫过于所谓的了,这是你比较组间差别前,首先我们最常见的应该是对各组各个访视值以及与基线相比的变化值作一简单描述。此时的描述,最常规的便是均值,标准差,中位数,最小最大值等,一般我们还可以通过的形式加以直观的呈现。下边才是你采用还是等各种统计方法进行组间比较的时候。
在分类型变量方面,最常见的便是类似等之类的两分类变量,我们首先需要做的是用频数表的形式,列出具体的频数和百分比,然后再用诸如卡方检验、精确检验、、以及一些复杂的混合模型进行统计比较。
在变量方面,也就是所谓的生存变量方面,我们首先做到的也是对具体变量的描述性分析,最常见的就是通过来进行诸如中位生存时间、,甚至各个时间点生存概率的描述;这时对生存变量的描述还有一个必不可缺的便是生存曲线,而通过这一曲线可直观地反应生存情况。下一步你便可以采用检验或者回归等进行相应的统计分析和比较了。当然在这里,小胖要提到的一点是,有些情况下,虽然你的变量是,但由于你的很低,这时再用来进行估计很多时候就没有多大意义,因为这是很可能你的中位生存时间、都是无法估计的。这时你可以直接采用频数表的形式,汇报即可,即当作简单的两分类变量来处理,而后边的比较你便可直接采用检验。
安全性分析
一项临床试验的主要目的,往往除了证实药物的疗效外,还有一项目的便是评估药物的安全性,而对于很多临床试验的安全性分析来说,一般不进行inferential& statistics,
此时描述性统计分析或者说是描述性总结成为其主要分析方法。下边我们结合安全性分析的几个主要部分,来看一下描述性统计分析在安全性分析中的应用。
(1)Extent of Exposure (药物暴露或用药程度)
在这部分中,一般对药物治疗时间以及给药剂量进行总结,而这种总结无外乎于用均值或中位数等来描述,另外也可根据治疗时间或给药剂量进行分类,并提供各个分类中的受试者的人数及百分比。
(2)Adverse Events (不良事件)
不良事件是安全性分析的一个核心部分,对于不良事件的分析,我们一般有以下几个主要部分:
&Overall的总结,即对发生不良事件、药物相关不良事件、严重不良事件、药物相关严重不良事件、导致停药的不良事件、导致死亡的不良事件等的受试者人数及百分比进行总结。
对所有不良事件、药物相关不良事件、严重不良事件、导致停药的不良事件、导致死亡的不良事件等,根据system organ class
(系统器官分类) 和preferred
term (标准术语)进行频数表分类总结
&对所有不良事件和药物相关不良事件根据系统器官分类、标准术语,按照不良事件轻重程度(轻、中和重)进行总结
&对所有不良事件根据系统器官分类、标准术语,按照与研究药物的关系进行总结
(3)Laboratory Test (实验室检查)
大部分临床试验会对一些实验室指标进行评价,常见的实验室检查可分为血常规、血生化和尿常规等检查,而对于实验室检查的分析一般可分为:
对每个访视的实验室检查指标值以及与基线相比的变化值进行总结(均值、标准差、中位数、最小值和最大值)
&对每个访视的实验室检查的指标值进行分类频数表描述总结,这种总结常见的分类有正常、异常无临床意义和异常有临床意义;以及根据实验室指标的正常值范围划分的高于正常值范围、低于正常值范围和在正常值范围内等。
&并采用转置表格总结描述自基线到各个访视各项检查指标结果的变化,如正常到正常、正常到异常无临床意义、正常到异常有临床意义;异常无临床意义到正常、异常无临床意义到异常无临床意义、异常无临床意义到异常有临床意义;异常有临床意义到正常、异常有临床意义到异常无临床意义、异常有临床意义到异常有临床意义等,类似的就是根据高于正常值范围、低于正常值范围和在正常值范围内等之间的相互转换。
发表评论:
TA的最新馆藏[转]&【图文】均值的比较检验_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
均值的比较检验
上传于||暂无简介
大小:1.69MB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢

我要回帖

更多关于 均值标准差公式 的文章

 

随机推荐