在统计学重要公式中,中心极限定理有何重要作用

您的位置: &
U-统计量的几乎处处中心极限定理了解中心极限定理
马克.吐温讽刺道:有三种避免讲zhenxiang的方式:谎言,该死的谎言和统计数据。这个笑话很中肯,因为统计信息频繁地看似一个黑匣子——了解统计定理怎样让通过数据取得结论变成可能,这是有难度的。但因为不论是喷气发动机可靠性还是安排我们平日看的电视节目的流程,数据分析,类似的任何事情中都扮演着重要角色,所以至少获取对统计基本理解是重要的。要了解其中一个重要概念是中心极限定理。
在这篇文章中,我们将解释中心极限定理,通过普通的例子,诸如掷骰子和美国职业棒球联赛球员生日来展示如何操作它。
定义中心极限定理
某典型课本对中心极限定理的定义如下:
当样本容量增加时,样本均值X的分布接近均值等于μ,标准差σ/√n
μ是总体均值
σ是总体标准差
n是样本大小
换句话说,如果我们多次采用大小为n的独立随机抽样,那么当n足够大的时,样本平均值的分布就接近正态分布。
那么多大才是足够大呢?一般来说,样本容量大于或者等于30认为是足够大,此时中心极限定理起作用。如果总体分布越要接近正态分布,那么需要更多的样本来使用该定理。对于严重不对称的或者有几个模板的总体来说,也许要求更大的样本。
从一个总体中收集所有的数据是很难操作或者不可行的,统计学就是基于这个情况产生的。换种方式来做,我们可以从总体中获取数据的子集,然后对这个样本进行统计分析,以得到总体的结论。
举例来说,我们可以从工业生产流程中收集多个随机样本,然后使用各个样本的平均值来推断整个过程的稳定性。2个常用于解释总体的特征值分别是平均值和标准差。当数据遵循正态分布,均值表示分布的中心位置,标准差揭示分布情况。
想象你在获取你做过的考试结果,除了接收你自己的成绩以外,你也要知道你同辈的平均分,然而,如果考试成绩不符合正态分布,平均分就容易让人造成误解了。
中心极限定理是卓越的,因为它暗示,无论总体分布如何,样本均值的分布将接近正态分布。该定理也允许我们对样本均值或许采取的价值的可能变化范围做可能性声明。这是因为正态分布有一个有用的东西——经验法则。规则阐明:对于正态分布的数据,
68%的数据在μ左右的1个σ内下降
95%的数据在μ左右的2个
99.7%的数据在μ左右的3个σ内下降
观看定理运用
观看它怎样使用时得中心极限定理更容易理解,我们将运用该理论到骰子和生日中。
例子1:掷骰子
为了说明中心极限定理,骰子是理想的,如果你掷有6面的骰子,掷到1的概率是1/6,2的概率是1/6,3的概率是1/6,以此类推……骰子落在任何一面的概率与任意其他5面的概率相等。
在教室的情况下,我们用真实的骰子进行这样的实验。二者择一的,我们可以使用Minitab的计算表》随机数据》整数菜单来节省时间。为了获得一个
总体的准确表示,让我们掷500次。当我们用柱形图来注标数据时,我们看到——和预期一样——分布看起来相当平坦,这肯定不是正态分布。
让我们取更多样本,看那些样本的均值的柱形图有何变化。
这次我们将连续掷2次骰子,重复这样的操作500次,同样的,我们用计算表》随机数据》整数来为大家
“掷”骰子。那么我们可以用计算表组统计值来计算每对的平均值。
之后,我们可以创建这些平均值的直方图来观看他们分布的形状,虽然蓝色的标准曲线没有准确的代表直方图,柱形的轮廓看起来更像铃。
现在我们掷5次,计算掷5次的平均值,依旧重复500次,然后我们重复掷10次,然后30次。
每个平均值的直方图显示:随着样本大小,或者掷的次数增加,平均值的分布越来越接近正态分布。除此以外,样本平均值的方差随样本大小的增加而减少。
中心极限定理阐明,对于足够的大n,X接近正态分布的均值μ和标准差σ/√n。
一个6面骰子的总体均值是(1+2+3+4+5+6) /6 = 3.5,并且总体标准差是1.708。
因此,如果定理适用,三十次的平均值的均值应该约为3.5,以及标准差1.708/√30 = 0.31。
使用我们在Minitab中掷过的骰子,
30次平均值的均值,在表4中有描述,为3.49,标准差为0.30。这2个数值跟计算的近似值很接近。
例子2:生日
现在我们使用生日展示中心极限定理。你将回想到骰子的每边有同等的概率。与大众的信仰相反,出生在周日与出生在周一,或者一周中的其他一天有相同的机会是没有必要的,当前,在美国最普遍的生孩子的日子是周三——周三比平日多15.4%的婴孩出生。但从1990年到2006年,星期二是最普遍的生日。
为了用生日演示中心极限定理,我们首先需要收集一些生日。学生可以收集他们朋友、家人和同事的生日。我们将使用700多个美国职业棒球大联盟球员的生日。这些文件可以在查到。
当然,大多数生日信息不会包括一周的哪一天。但是使用Minitab的数据&摘录日期/时间&数字化。我们不难发现每名棒球运动员出生在哪一天。例如,Minitab可以告诉我们,杰特,他生日是日
,是出生在周三的。
相当于周日,2相当于周一,以此类推,建立直方图。我们看棒球运动员总体的直方图,我们可以看到生日不遵循正态分布。并且周二(3)是最流行的一天。
就像我们做的骰子实验一样,现在我们将创建多个大小为2的样本,随机取2个队员,然后另外2个,等等。让我们总共取100个样本,从工作表数据中随机取队员生日,我们可以用试算表&随机数据&列取样。
然后让我们使用试算表&行统计对任意大小为2的样本计算平均生日。
我们将重复随机取样5名队员做平均值,然后10名队员,然后30名,对每组的平均值建立直方图。
在原始的700多名棒球运动员的直方图中,我们看到一个非正态分布,当我们看平均值的直方图时,我们看到马上就像正态分布,以及样本大
这个理论也许通常不能再统计界外被讨论,但这是一个重要的概念。我们可以通过骰子、生日、硬币上的日期、航班延误、循环周期所进行的论证来更容易的理解。
随着对中心极限定理以及其他统计概念更好的理解,求知欲强烈的学生将很快发现能够更容易区分谎言、该死的谎言、违背完备统计信息的真理。
(本文转载自网络)
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。统计学的作用是什么?
统计学自身的发展领域不仅更宽广,而且统计学在计算机科学、信息科学、经济学、管理学、金融工程等领域都有广泛的应用并与之有力结合,共同发展.1、计算机是统计学的基础工具对于统计学来说,我们应该看到,计算机与数学一样,是统计学的基础工具.计算机的发展使得比较复杂的数据计算变得简便快捷,成为统计计算的重要工具.当今,个人计算机的普及,英特网的使用,使社会产生了很大的变革,使信息传递的质和量都发生了飞跃的变化.统计学的发展不能离开计算机.毫无疑问,我们的学生应该学习相关的计算机科学知识.这将包括数据结构、算法设计、程序语言设计、程序设计方法、数据库系统的开发与管理、程序设计等等.我们也应该扩展我们的课程计划,它应该包括当前的计算机定向数据分析方法,它们大部分是在统计学科之外发展起来的.如此一来,无疑会大大丰富统计学专业的就业范围.2、数据挖掘(Data Mining)是统计学的一部分笔者认为,数据挖掘是与统计学息息相关的,应当是统计学的一部分.数据挖掘是揭示存在于数据里的模式及数据间的关系的学科,它强调对大量观测到的数据库的处理.它是涉及数据库管理,人工智能,机器学习,模式识别,及数据可视化等学科的边缘学科.用统计的观点看,它可以看成是通过计算机对大量的复杂数据集的自动探索性分析.数据挖掘既然也是数据处理,统计学也就应该积极借鉴.在统计学的发展历史上,许多数据处理相关领域发展的新方法被忽略了.比如,模式识别,神经网络,图形模型,数据可视化等等都是在统计科学中出现萌芽,但随后绝大部分又被统计学忽略的方法领域.而这些方法领域又是当今世界高尖端科技的领域,统计学对它们的忽略是痛心疾首的.因此,既然统计学可以在数据挖掘科学中发挥作用,统计学就应该和数据挖掘合作,而不是将它甩给计算机科学家,从而又失去一次自我增值的机会.21世纪是信息的世纪,统计学将与计算机紧密结合,将与数据挖掘紧密合作,以全新的形式得到更广泛的应用.据统计,计算机专业的就业率高达90%,随着统计学的发展,这个份额必将被统计学专业人才所瓜分.因为计算机专业人员大都缺少必要的数据统计分析理论与方法,而时代又对数据的精度与可信度提出了更高的要求,具有现代统计技术、计算机技术与数据挖掘技术的复合人才无疑是更加吃香的.3、统计学与经济学、管理学、金融工程等学科的结合由于数据处理及数据采集挖掘的方法呈现出多样化,统计分析方法也相对复杂化,专业化.统计学的应用不仅要不断提高理论统计学的基本素质,还要注重掌握经济学的理论,金融交易制度及金融理论,管理科学的理论与计算机的技术方法.统计理论与应用的紧密结合显得比以往任何一个时期都更为迫切,更加重要.就拿统计学与金融工程来说,金融工程属于交叉性学科,包括以下3个领域:(1)投资分析;(2)风险管理;(3)期货交易.其中投资分析与风险管理两个领域直接涉及到统计数据描述及推测统计学,期货交易部分主要是与数学有关的应用概率过程,应用概率微分方程式的研究领域,有时被称为数理金融.无论哪个领域,金融工程与统计学都是密切相关的,金融分析离不开统计.目前,注册金融分析师(CFA) 在中国需求量越来越大,但是只有传统的金融理论,金融制度的知识,是远远不够的.CFA对数量技术要求很高,其中尤为重要的就是统计的知识;固定收益证券分析,权益证券分析都要用到各种统计方法.据报道,中国本土金融分析师(CFA)几乎为零,但中国加入WTO后,金融市场对CFA的需求量又很大,这势必造成一个巨大的就业空间.因此,统计学与金融工程的结合,也是统计学发展的一个非常有潜力的空间.4、统计学自身的发展统计学不仅要注重与其它学科的结合,统计学自身在统计原理、统计技术、统计方法等领域也要谋求创新和突破.正如本文一开始就提到,我国过去乃至目前,都还是偏重在社会经济统计方面的研究.数理统计学、数据挖掘是统计学的一部分,这已经为很多统计学家、统计学者所认同.因而,统计学就得把它们纳入发展范围,而不是像过去那样,把原本属于自身的东西再次抛弃.数理统计学、数据挖掘给统计方法和统计技术带来更广阔的发展前景,这不仅有利于统计学研究范畴的扩大,也利于统计工作信息化的发展.5、再谈统计就业众所周知,政府统计、部门统计、民间统计是我国统计工作领域的三大巨头.一直以来,政府统计、部门统计在统计学生的就业中占有较高的比重.然而,随着社会主义市场的完善,随着中国全球化贸易的发展,民间统计越来越热.民间统计是政府统计之外的涉及市场调研、统计分析、预测和决策等内容的一系列统计活动,包括各类统计调查公司、统计信息咨询中心、统计师事务所、统计研究所,以及把统计方法运用于企业决策和管理的企业管理咨询公司等,是介于市场和企业、居民之间的一个桥梁,主要为企业和居民提供市场微观信息.民间统计机构,由于其服务的多样性、形式的灵活性,目前在我国获得大幅度的发展,已经逐渐为广大统计学生提供广阔的就业机会.随着民间统计机构的持续发展,笔者相信,民间统计机构必将成为统计学生就业的主要渠道之一.
为您推荐:
其他类似问题
扫描下载二维码2014考研数学:大数定律和中心极限定理题型解析
来源:  9:53:55 【】 
了帮助这些考生能顺利通过考试,老师针对历年考研数学的题型特点,进行深入解剖,分析提炼出各种题型及方法,供考生们参考。下面主要分析概率统计部分中的大数定律和中心极限定理的题型及解题方法。
  随着2014年考研日期的日趋临近,莘莘学子们正忙碌而紧张地进行着各考试科目的最后总复习,在各门考试科目中,数学作为一门公共科目,常常令一些考生感到头疼、没有把握,这一方面是因为数学本身的逻辑性、连贯性很强、公式多、计算量大,要学好它有一定难度,另一方面是因为某些考生以前对数学的重视程度不够,基础知识学得不够扎实,所以面对即将到来的大考信心不足。为了帮助这些考生能顺利通过考试,老师针对历年考研数学的题型特点,进行深入解剖,分析提炼出各种题型及方法,供考生们参考。下面主要分析概率统计部分中的大数定律和中心极限定理的题型及解题方法。
  题型:概率统计中的大数定律和中心极限定理的题型及解题方法
  概率统计中的大数定律和中心极限定理的题型,在考研数学(一)和(三)的历年考试中出现的频率虽然不高,但仍在考试大纲范围之内,考试中仍有可能出现这种题型,因此,考生们对这种题型也应该有所了解,对基本题的解题方法应该掌握。
  解答这种题型,首先要理解考试大纲中要求的3个大数定律和两个中心极限定理。下面我们简述一下这几个定理。
  切比雪夫大数定律:设随机变量X1,X2,…相互独立,E(Xi)=μi,{D(Xi),i=1,2,…}有界,则ε&0,
  辛钦大数定律:设随机变量X1,X2,…相互独立且服从同一分布,E(Xi)=μ,i=1,2,…,则ε&0,&
  伯努利大数定律:设在n次独立重复试验中事件A发生的次数为fA,P(A)=p,则
  独立同分布的中心极限定理:设随机变量X1,X2,…相互独立且服从同一分布,E(Xi)=μ,D(Xi)=σ2&0,i=1,2…,则的标准化随机变量 依分布收敛于标准正态分布,即 。
  棣莫弗-拉普拉斯中心极限定理:设随机变量~B(n,p)(n=1,2,…),0&p&1,则的标准化随机变量 分布收敛于标准正态分布。
  与大数定律相关的还有切比雪夫不等式:
  例1.设总体X服从参数为2的指数分布,X1,X2,…,Xn为来自总体X的简单随机样本,则当n→∞时,依概率收敛于___
  (2003年考研数学三真题第一(6)题)
  解析:因为X1,X2,…,Xn独立同分布,所以X12,X22,…,Xn2也独立同分布,由辛钦大数定律知
&依概率收敛于E(X2)=D(X)+E2(X)=,故正确答案是
  例2.生产线生产的产品成箱包装,每箱的重量是随机的,假设每箱平均重50千克,标准差为5千克,若用最大载重为5吨的汽车承运,试利用中心极限定理说明每辆车最多可以装多少箱,才能保证不超载的概率大于0.977 ? (Φ(2)=0.977,其中Φ(x)是标准正态分布函数)
  (2001年考研数学三真题第十一题)
  解:设Xi表示i箱的重量(千克),共n箱,由题设可知X1,X2,…,Xn独立同分布,且E(Xi)=50,D(Xi)=52=25,由中心极限定理得P()= ,故最多可以装98箱。
  例3.设随机变量 X,Y的数学期望分别为-2和2,方差分别为1和4,而相关系数为-0.5,则根据切比雪夫不等式P{|X+Y|≥6}≤__
  (2001年考研数学三真题第一(4)题)
  解析:使用切比雪夫不等式时需要知道X+Y的期望和方差。令Z=X+Y,则E(Z)=E(X)+E(Y)=-2+2=0,Cov(X,Y)=,D(X+Y)=D(X)+D(Y)+2Cov(X,Y)=1+4-2=3,于是P{|X+Y|≥6}=P{|Z-E(Z)|≥6}
  上面就是考研数学中概率统计部分的大数定律和中心极限定理的题型及解题方法,供考生们参考借鉴。在以后的时间里,老师还会陆续向考生们介绍其它考研数学题型及解题方法,希望各位考生留意查看。最后预祝各位考生在2014考研中取得佳绩。  编辑推荐:
文章责编:zhouxin1879& 看了本文的网友还看了
?&&( 11:55:26)?&&( 11:23:39)?&&( 11:21:05)?&&( 15:05:43)?&&( 16:58:33)?&&( 16:57:27)
?智能练习?智能评估
扫描二维码下载
在线名师:  
著名政治教育专家;研究生、博士生导师;中国国家人事人才培...[]
在线名师:  
北京师范大学英语语言美文学硕士。屠老师的课堂气氛活跃...[]
在线名师:  
教授,毕业于北京大学,拥有计算机、数学、金融.....[]
在线名师:  
北京外国语大学英语语言文学学士、北京大学哲学系宗教硕士...[]
? ?   ? ?   ? ?   ? ?   ? ?
? ?   ? ?   ?
?   ? ?    ? ?   ? ?   ? ?   ? ?
? ?   ? ?
实用工具 |
| 大全 | 大全
     |
版权声明:如果网所转载内容不慎侵犯了您的权益,请与我们联系,我们将会及时处理。如转载本内容,请注明出处。
Copyright & 2004- 网 All Rights Reserved 中国科学院研究生院权威支持(北京) 电 话:010- 传 真:010-中心极限定理应用_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
中心极限定理应用
上传于||暂无简介
阅读已结束,如果下载本文需要使用0下载券
想免费下载更多文档?
定制HR最喜欢的简历
下载文档到电脑,查找使用更方便
还剩2页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢

我要回帖

更多关于 医学统计学重要性 的文章

 

随机推荐