假定一正态分布期望和方差其平均数为16,方差为4,计算其分布中间50%观察值的全距

已知样本容量16,服从正态分布,样本方差为4,求样本均值小于1.3的概率_百度作业帮
已知样本容量16,服从正态分布,样本方差为4,求样本均值小于1.3的概率
已知样本容量16,服从正态分布,样本方差为4,求样本均值小于1.3的概率习题_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
文档贡献者
评价文档:
喜欢此文档的还喜欢
把文档贴到Blog、BBS或个人站等:
普通尺寸(450*500pix)
较大尺寸(630*500pix)
大小:664.50KB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢正态分布_百度百科
关闭特色百科用户权威合作手机百科
收藏 查看&正态分布
正态分布(Normal distribution)又名(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的分布,在的许多方面有着重大的影响力。若X服从一个为μ、为σ^2的,记为N(μ,σ^2)。其为正态分布的μ决定了其位置,其σ决定了分布的幅度。因其呈钟形,因此人们又经常称之为。我们通常所说的是μ = 0,σ = 1的正态分布。外文名Gaussian curve所属学科概率论
若服从一个位置参数为、尺度参数为的概率分布,且其为
则这个随机变量就称为正态随机变量,正态随机变量服从的分布就称为正态分布,记作,读作服从,或服从正态分布。
当时,正态分布就成为标准正态分布
正态分布的概率密度函数曲线呈钟形,因此人们又经常称之为钟形曲线。
正态曲线呈钟型,两头低,中间高,左右对称,曲线与横轴间的总等于1。
正态分布正态分布一种分布,也称“常态分布”。正态分布具有两个参数μ和σ^2的的分布,第一参数μ是服从正态分布的随机变量的,第二个参数σ^2是此随机变量的,所以正态分布记作N(μ,σ^2)。服从正态分布的随机变量的概率规律为取与μ邻近的值的概率大,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。
正态分布的密度的特点是:关于μ对称,并在μ处取最大值,在正(负)无穷远处取值为0,在μ±σ处有,形状呈现中间高两边低,图像是一条位于x轴上方的钟形。当μ=0,σ^2 =1时,称为,记为N(0,1)。μ维随机具有类似的概率规律时,称此随机向量遵从多维正态分布。多元正态分布有很好的性质,例如,多元正态分布的边缘分布仍为正态分布,它经任何变换得到的随机仍为多维正态分布,特别它的线性为一元正态分布。
正态分布最早由A.棣莫弗在求的渐近中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。[1]
正态分布应用最广泛的,其特征是“钟”形。正态分布公式服从正态分布的变量的频数分布由μ、σ完全决定。
集中性:正态曲线的高峰位于正中央,即所在的位置。:正态曲线以为中心,左右对称,曲线两端永远不与相交。
均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。
正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ2):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平。
u变换:为了便于描述和应用,常将正态变量作数据转换。μ是正态分布的位置参数,描述正态分布的位置。正态分布以X=μ为,左右完全对称。正态分布的、、相同,均等于μ。
σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。
1.实际工作中,正态曲线下横轴上一定区间的面积反映该区间的例数占总例数的百分比,或变量值落在该区间的概率(概率分布)。不同 范围内正态曲线下的面积可用公式计算。
⒉几个重要的面积轴与正态曲线之间的面积恒等于1。正态曲线下,区间(μ-σ,μ+σ)内的面积为68.268949%,横轴区间(μ-1.96σ,μ+1.96σ)内的面积为95.449974%,横轴区间(μ-2.58σ,μ+2.58σ)内的面积为99.730020%。[2]一般正态分布与标准正态分布的
由于一般的正态总体其图像不一定关于y,对于任一正态总体,其取值小于x的概率。只要会用它求正态总体在某个特定区间的概率即可。“”和假设检验的基本思想“小概率事件”通常指发生的概率小于5%的事件。
一般正态分布与标准正态分布的区别与联系
正态分布也叫常态分布,是连续随机变量概率分布的一种,界、人类社会、和中大量现象均按正态形式分布,例如能力的高低,学生成绩的好坏等都属于正态分布。标准正态分布是正态分布的一种,具有正态分布的所有特征。所有正态分布都可以通过Z公式转换成标准正态分布。
两者特点比较:
⑴正态分布的形式是对称的,对称轴是经过点的垂线。
⑵中央点最高,然后逐渐向两侧下降,曲线的形式是先向内弯,再向外弯。
⑶正态曲线下的面积为1。正态分布是一族分布,它随随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。标准正态分布是正态分布的一种,其平均数和标准差都是固定的,平均数为0,标准差为1。
⑷正态分布曲线下标准差与概率面积有固定数量关系。所有正态分布都可以通过Z分数公式转换成标准正态分布。
1.集中性:正态曲线的高峰位于正中央,即均数所在的位置。
2.对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。
3.均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。
4.正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ)。
5.u变换:为了便于描述和应用,常将正态变量作数据转换。
3σ原则正态分布曲线性质
1.当x&;μ时,曲线上升;当x&;μ时,曲线下降。当曲线向左右两边无限延伸时,以x轴为。2.正态曲线关于x=μ对称。3.σ越大,正态曲线越扁平;σ越小,正态曲线越尖陡。4.在正态曲线下方和x轴上方范围内区域面积为1。3σ原则:P(μ-σ&X≤μ+σ)=68.3%P(μ-2σ&X≤μ+2σ)=95.4%P(μ-3σ&X≤μ+3σ)=99.7%
标准正态曲线
标准正态曲线N(0,1)是一种特殊的正态分布曲线,以及标准正态总体在任一(a,b)内取值概率。
“小概率事件”和的基本思想 “小概率事件”通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。这种认识便是进行推断的出发点。关于这一点我们要有以下两个方面的认识:一是这里的“几乎不”是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事件几乎不可能发生的原理”进行推断时,我们也有5%的犯错误的可能。
1.标准正态分布是一种特殊的正态分布,标准正态分布的μ和σ^2为0和1,通常用ξ(或Z)表示服从标准正态分布的变量,记为 Z~N(0,1)。
2.标准化变换:此变换有特性:若原分布服从正态分布 ,则Z=(x-μ)/σ ~ N(0,1) 就服从标准正态分布,通过查标准正态分布表就可以直接计算出原正态分布的概率值。故该变换被称为标准化变换。
⒊ 标准正态分布表:标准正态分布表中列出了标准正态曲线下从-∞到X(当前值)范围内的面积比例。正态分布是最重要的一种概率分布。正态分布是由德国的家和天文学家Moivre于1733年首次提出的,但由于德国Gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布,高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二的发明权归之于他,也是出于这一工作。高斯是一个伟大的数学家,重要的贡献不胜枚举。但现今德国10的印有高斯头像的钞票,其上还印有正态分布的。这传达了一种想法:在高斯的一切科学贡献中,其对影响最大者,就是这一项。在高斯刚作出这个发现之初,也许人们还只能从其理论的简化上来评价其优越性,其全部影响还不能充分看出来。这要到20世纪正态小样本理论充分发展起来以后。很快得知高斯的工作,并马上将其与他发现的中心极限定理联系起来,为此,他在即将发表的一篇文章(发表于1810年)上加上了一点补充,指出如若误差可看成许多量的叠加,根据他的中心极限定理,误差理应有。这是历史上第一次提到所谓“元误差学说”——误差是由大量的、由种种原因产生的元误差叠加而成。后来到1837年,海根(G.Hagen)在一篇论文中正式提出了这个学说。
其实,他提出的形式有相当大的局限性:海根把误差设想成个数很多的、独立同分布的“元误差” 之和,每只取两值,其概率都是1/2,由此出发,按狄莫佛的中心极限定理,立即就得出误差(近似地)服从正态分布。拉普拉斯所指出的这一点有重大的意义,在于他给误差的正态理论一个更自然合理、更令人信服的解释。因为,高斯的说法有一点循环论证的气味:由于平均是优良的,推出误差必须服从正态分布;反过来,由后一结论又推出算术平均及最小二乘估计的优良性,故必须认定这二者之一(算术平均的优良性,误差的正态性) 为出发点。但算术平均到底并没有自行成立的理由,以它作为理论中一个预设的出发点,终觉有其不足之处。拉普拉斯的理论把这断裂的一环起来,使之成为一个和谐的整体,实有着极重大的意义。正态分布的概念及特征:
一、正态分布的概念
由一般分布的频数表资料所绘制的直方图,图⑴可以看出,高峰位于中部,左右两侧大致对称。我们正态分布研究图1设想,如果观察例数逐渐增多,组段不断分细,直方图顶端的连线就会逐渐形成一条高峰位于中央(均数所在处),两侧逐渐降低且左右对称,不与横轴相交的光滑曲线图⑶。这条曲线称为曲线或,近似于数学上的正态分布(normal distribution)。由于频率的总和为100%或1,故该曲线下上的面积为100%或1。
为了应用方便,常对正态分布变量X作变量变换。
该变换使原来的正态分布为(standard normal distribution),亦称u分布。u被称为标准或标准正态(standard normal deviate)。正态分布研究图2正态分布研究图3实际工作中,常需要了解正态曲线下上某一区间的面积占总面积的,以便估计该区间的例数占总例数的百分数()或观察值落在该区间的概率。正态曲线下一定区间的面积可以通过附表1求得。对于正态或近似正态分布的资料,已知和标准差,就可对其作出概约估计。
查附表1应注意:①表中曲线下面积为-∞到u的左侧累计面积;②当已知μ、σ和X时先按式u=(X-μ)/σ求得u值,再查表,当μ、σ未知且样本含量n足够大时,可用样本均数X1和标准差S分别代替μ和σ,按u=(X-X1)/S式求得u值,再查表;③曲线下对称于0的区间面积相等,如区间(-∞,-1.96)与区间(1.96,∞)的面积相等,④曲线下横轴上的总面积为100%或1。
图2 正态曲线与标准正态曲线的面积分布
正态分布的应用某些医学现象,如同质群体的身高、红数、血红蛋白量、胆固醇等,以及实验中的随机误差,呈现为正态或近似正态分布;有些资料虽为偏态分布,但经数据变换后可成为正态或近似正态分布,故可按正态分布规律处理。
正态分布面积图1正态分布面积图2综述
⒈ 估计频数分布 一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例。
⒉ 制定参考值范围
⑴正态分布法 适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。
⑵百分位数法 常用于偏态分布的指标。表3-1中两种方法的单双侧界值都应熟练掌握。
⒊ 质量控制:为了控制实验中的测量(或实验)误差,常以 作为上、下警戒值,以 作为上、下控制值。这样做的依据是:正常情况下测量(或实验)服从正态分布。
⒋ 正态分布是许多统计方法的理论基础。检验、、相关和等多种均要求分析的指标服从正态分布。许多虽然不要求分析指标服从正态分布,但相应的在大样本时近似正态分布,因而大样本时这些方法也是以正态分布为理论基础的。例1.10 某地1993年抽样调查了100名18岁男大学生身高(cm),其均数=172.70cm,标准差s=4.01cm,①估计该地18岁男大学生身高在168cm以下者占该地18岁男大学生总数的百分数;②分别求X+-1s、X+-1.96s、X+-2.58s范围内18岁男大学生占该地18岁男大学生总数的实际百分数,并与理论百分数比较。
本例,μ、σ未知但样本含量n较大,按式(3.1)用样本均数X和S分别代替μ和σ,求得u值,u=(168-172.70)/4.01=-1.17。查附表标准正态曲线下的面积,在表的左侧找到-1.1,表的上方找到0.07,两者相交处为0.%。该地18岁男大学生身高在168cm以下者,约占总数12.10%。其它计算结果见表3。
表3 100名18岁男大学生身高的实际分布与理论分布
身高范围(cm)
百分数(%)
理论分布(%)
168.69~176.71
164.84~180.56
162.35~183.05
考试成绩及学生综合素质研究
统计规律表明,学生的智力水平,包括学习能力,实际动手能力等呈正态分布。因而正常的考试成绩分布应基本服从正态分布。考试分析要求绘制出学生成绩分布的,以“中间高、两头低”来衡量成绩符合正态分布的程度。其评价标准认为:考生成绩分布情况,基本呈正态曲线状,属于好,如果略呈正(负)态状,属于中等,如果呈严重偏态或无规律,就是差的。
从概率统计规律看,“正常的考试成绩分布应基本服从正态分布”是正确的。但是必须考虑人与物的本质不同,以及教育的有所作为可以使“随机”受到干预,用曲线或的形状来评价考试成绩就有失偏颇。许多教育专家(如上海顾泠沅、美国布鲁姆等)已经通过实践论证,教育是可以大有作为的,可以做到大多数学生及格,而且多数学生可以得高分,考试成绩曲线是偏正态分布的。但是长期受到“中间高、两头低”标准的影响,限制了教师的作为,抑制了多数学生能够学好的信心。这是很大的误会。通常正态曲线有一条对称轴。当某个分数(或分数段)的考生人数最多时,对应曲线的最高点,是曲线的顶点。该在上的对应点与顶点连接的就是该正态曲线的。考生人数最多的值是峰值。我们注意到,成绩曲线或实际上很少对称的,称之为峰线更合适。某些医学现象,如同质群体的身高、红细胞数、血红蛋白量,以及实验中的,呈现为正态或近似正态分布;有些指标(变量)虽服从,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理。其中经对数转换后服从正态分布的指标,被称为服从对数正态分布。
医学参考值范围亦称医学正常值范围。它是指所谓“正常人”的解剖、生理、生化等指标的波动范围。制定正常值范围时,首先要确定一批样本含量足够大的“正常人”,所谓“正常人”不是指“健康人”,而是指排除了影响所研究指标的疾病和有关因素的同质人群;其次需根据研究目的和使用要求选定适当的百分界值,如80%,90%,95%和99%,常用95%;根据指标的实际用途确定单侧或双侧界值,如计数过高过低皆属不正常须确定双侧界值,又如肝功中转氨酶过高属不正常须确定单侧上界,肺活量过低属不正常须确定单侧下界。另外,还要根据资料的分布特点,选用恰当的计算方法。常用方法有:
⑴正态分布法:适用于正态或近似正态分布的资料。
双侧界值:X+-u(u)^S单侧上界:X+u(u)^S,或单侧下界:X-u(u)^S
⑵对数正态分布法:适用于对数正态分布资料。
双侧界值:lg-1[X(lgx)+-u(u)S(lgx)];单侧上界:lg-1[X(lgx)+u(u)S(lgx)],或单侧下界:lg-1[X(lgx)-u(u)S(lgx)]。
常用u值可根据要求由表4查出。
⑶百分位数法:常用于偏态分布资料以及资料中一端或两端无确切数值的资料。
双侧界值:P2.5和P97.5;单侧上界:P95,或单侧下界:P5。
表4常用u值表
参考值范围(%)
统计的理论基础
如t分布、F分布、分布都是在正态分布的基础上推导出来的,u检验也是以正态分布为基础的。此外,t分布、、Poisson分布的极限为正态分布,在一定条件下,可以按正态分布原理来处理。
概率论中最重要的分布
正态分布有极其广泛的实际背景,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的、、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见)。从理论上看,正态分布具有很多良好的性质 ,许多可以用它来近似;还有一些常用的是由它直接导出的,例如、、F分布等。
在联系自然、社会和思维的实践背景下,我们以正态分布的本质为基础,以正态分布曲线及面积分布图为表征(以后谈及正态分布及正态分布论就要浮现此图),进行与提升,抓住其中的主要哲学内涵,归纳正态分布论(正态哲学)的主要内涵如下:
正态分布启示我们,要用整体的观点来看事物。“的整体观念或总体观念是系统概念的精髓。” 正态分布曲线及面积分布图由、负区、正区三个区组成,各区比重不一样。用整体来看事物才能看清楚事物的本来面貌,才能得出事物的根本特性。不能只见树木不见森林,也不能以偏概全。此外整体大于部分之和,在分析各部分、各层次的基础上,还要从整体看事物,这是因为整体有不同于各部分的特点。用整体观来看世界,就是要立足在,放眼负区和正区。要看到主要方面,还要看到次要方面,既要看到积极的方面还要看到事物消极的一面,看到事物前进的一面还要看到落后的一面。片面看事物必然看到的是或者是变态的事物,不是真实的事物本身。
正态分布曲线及面积分布图非常清晰的展示了重点,那就是基区占68.27%,是主体,要重点抓,此外95%,99%则展示了正态的全面性。认识世界和改造世界一定要住住重点,因为重点就是事物的主要,它对事物的发展起主要的、支配性的作用。抓住了重点才能一举其纲,万目皆张。事物和现象纷繁复杂,在千头万绪中不抓住主要矛盾,就会陷入无限琐碎之中。由于我们和精力的相对有限性,出于效率的追求,我们更应该抓住重点。在正态分布中,基区占了主体和重点。如果我们结合,我们更可以大胆的把正区也可以看做是重点。
联系和发展是事物发展变化的基本规律。任何事物都有其产生、发展和灭亡的历史,如果我们把正态分布看做是任何一个系统或者事物的发展过程的话,我们明显的看到这个过程经历着从负区到基区再到正区的过程。无论是自然、社会还是人类的思维都明显的遵循这这样一个过程。准确的把握事物或者事件所处的历史过程和阶段极大的有助于掌握我们对事物、事件的特征和性质,是我们分析问题,采取对策和解决问题的重要基础和依据。发展的阶段不同,性质和特征也不同,分析和解决问题的办法要与此相适应,这就是,也是解放思想、实事求是、与时俱乐进的精髓。正态发展的特点还启示我们,大都是渐进的和累积的,走渐进发展的道路是事物发展的常态。例如,遗传是常态,变异是非常态。
总之,正态分布论是科学的世界观,也是科学的方法论,是我们认识和改造世界的最重要和最根本的工具之一,对我们的理论和实践有重要的指导意义。以正态哲学认识世界,能更好的认识和把握世界的本质和规律,以正态哲学来改造世界,能更好的在尊重和利用客观规律,更有效的改造世界。
弗朗西斯·高尔顿 [Francis Galton -],英国探险家、优生学家、家,差异心理学之父,也是心理测量学上生理计量法的创始人。
高而顿对心理学的贡献,大概可以归纳未差异心理学、心理测量的量化和实验心理学三方面:
⒈他率先研究个体差异。他在伦敦南肯辛顿博物馆他的人类测量内,利用仪器作人类学测量及心理测量。测量项目有、、、和、扣击的速率、、、等,以研究能力的个体差异。又用问答法研究意象的个体差异。要求被试先确定一件事,如早餐的情境,然后被试回忆心目中出现餐桌上实物的意象,即食物的鲜明度、确定度等。对答案整理后,他发现被试的意象有很大的个体差异:有的人以肌肉运动觉意象为主,有的人以听觉意象为主,有的人以视觉意象为主。
他强调遗传是形成个体差异的原因。他通过谱系调查,论证遗传因素与个体差异的关系。他是第一个明确提出普通能力和特殊能力主张的人。他在调查
年这100年间英国的首相、将军、文学家和共 977 名获得智力成熟的人的家谱后发现,其中有89个、129个、114个,共332名杰出人士。而在一般老百姓中4000人才产生一名杰出人士。因此断言“普通能力”是遗传的。在调查30家有艺术能力的家庭中,他发现这些家庭中的子女也有艺术能力的占64%;而150家无艺术能力的家庭,其子女中只有21%有艺术能力,因此断言艺术能力 - “特殊能力”也是遗传的。他发现,遗传亲属关系程度的降低,杰出亲属的比例也显著地下降。他还用80对双生子的资料,以双生子比其他亲兄弟、亲姐妹在心理特点上更为相像的事例,人的心理完全是遗传的。由此也使他第一个注意到和在估计遗传和环境因素在人的变异方面的相对作用的方法论的重要性。高尔顿根据与个体差异的关系倡导善择配偶,改良人种,并在1883年《人类才能及其发展的研究》一书中首创“”这一术语。
⒉心理学研究之量化,始自高尔顿。他发明了许多感官和运动的测试,并以数量代表所测得的心理特质之差异。他认为人的所有特质,不管是的还是精神的,最终都可以定量叙述,这是实现人类科学的必要条件,故最先应用统计法处理心理学研究资料,重视数据的平均数与高中差数。他收集了大量资料证明人的心理特质在人口中的分布如同身高、体重那样符合正态分布曲线。他在论及遗传对个体差异的影响时,为的概念作了初步提示。如他研究了“居间亲”和其成年子女的身高关系,发现居间亲和其子女的身高有正相关,即父母的身材较高,其子女的身材也有较高的趋势。反之,的身材较低,其子女也有较矮的趋势。同时发现子女的身高常与其父母略有差别,而呈现“回中”趋势,即离开其父母的身高数,而回到一般人身高的。
⒊1883年,高尔顿出版了《人类才能及其发展的研究》,书中概括地表述了两项在实验心理学中极为重要的研究方法和成果。第一个是关于自由联想的实验:他事先在75张纸条上各写一个单词,每次只让受试者看一张纸条,再用一个精密的计时器测出由此引出的两个即兴到来的联想所需的时间,然后对这些联想在受试者的经验中的可能起源加以分析,他发现最经常的联想往往来自遥远的童年。在这项实验中,他还证实人类具有一种看到或听到某一就能联想到某一特定形状的能力,他称这种现象为“数目形”。第二个是关于心理意象的广泛调查:他要求受试者先想一件确定的东西,然后尽量注意自己的“心视”画面,并回答如明亮度,清晰度、色彩等一系列问题,并按其强度记分。值得一提的是,在这些研究中,他首先在心理学中引进了调查表和评分办法。他对的贡献还包括一系列他所发明的心理测验仪器和测验方法。有些后来就以他的名字来命名,例如测量听觉阈的高尔顿笛和测量视觉范围的高尔顿棒,这些仪器直到20世纪30年代都是心理实验室的标准仪器。他还用盛有不同物质的来测验嗅觉,这一方法被后人沿用至今。除此之外,他又设计了测量肌肉感觉、反应力、触觉的仪器和方法。
注:美国心理学家特尔曼(L. M. Terman)曾根据有关文献的记载,用他自己设计的斯坦福 - 比纳标准对幼年的高尔顿的智力进行了估算,他认为高尔顿3-8岁间的智力年龄几乎等于实际年龄的2倍,其约为200。
智力、能力
理查德·赫恩斯坦 [(Richard J. Herrnstein -),美国比较学家]和默瑞(Charles Murray)合著《正态》一书而闻名,在该书中他们指出人们的智力呈正态分布。智力主要是遗传的并因种族的不同而不同,犹太人、东亚人的智商最高,其次为白人,表现最差的是黑人、西班牙裔人。他们检讨了数十年来心理计量学与政策学的研究成果,发现美国社会轻忽了智商的影响愈变愈大的趋势。他们力图证明,美国现行的偏向于以非洲裔和南美裔为主的低收入阶层的社会政策,如职业培训、大学教育等,完全是在浪费资源。他们利用应募入伍者的测试结果证明,黑人青年的智力低于白人和;而且,这些人的智力已经定型,对他们进行培训收效甚微。因此,政府应该放弃对这部分人的教育,把钱用于包括所有种族在内的启蒙教育,因为孩子的智力尚未定型,开发潜力大。由于此书涉及黑人的智力问题,一经出版便受到来自四面八方的围攻。
新手上路我有疑问投诉建议参考资料 查看无标题文档
第五章&&集中趋势与离中趋势的度量
一、填空题
1.平均数就是在_____内将各单位数量差异抽象化,用以反映总体的_____。
2.权数对算术平均数的影响作用不决定于权数_____的大小,而决定于权数的_____的大小。
3.几何平均数是_____,它是计算_____喝平均速度的最适用的一种方法。
4.当标志值较大而次数较多时,平均数接近于标志值较_____的一方;当标志值较小而次数较多时,平均数靠近于标志值较_____的一方。
5.当_____时,加权算术平均数等于简单算术平均数。
6.利用组中值计算加权算术平均数是假定各组内的标志值是_____分布的,其计算结果是一个_____。
7.统计中的变量数列是以_____为中心而左右波动,所以平均数反映了总体分布的_____。
8.中位数是位于变量数列_____的那个标志。中位数和众数也可以称为_____平均数。
9.调和平均数是平均数的一种,它是_____的算术平均数的_____。
10.现象的_____是计算或应用平均数的原则。
11.当变量数列中算术平均数大于众数时,这种变量数列的分布呈_____分布;反之算术平均数小于众数时,变量数列的分布则呈_____分布。
12.较常使用的离中趋势指标有_____、_____、_____、_____、_____。
13.极差是总体单位的_____与_____之差,在组距分组资料中,其近似值是__________。
14。一是非标志的平均数为__________、标准差为_____。
15.标准差系数是_____与_____之比。
16.以知某数列的平均数是200,标准差系数是30%,则该数列的方差是_____。
17.以知某数列的分布如下:
则该数列的极差为_____,四分位差为_____。
18.对某村6户居民家庭共30人进行调查,所得的结果是,人均收入400元,其离差平方和为5100000,则标准差是_____,标准差系数是_____。
19.测定峰度,往往以_____为基础。依据经验,当β=3时,次数分配曲线为_____;当β&3时,为_____曲线;当β>3时,为_____曲线。
20.在对称分配的情况下,平均数、中位数与众数是_____的。在偏态分配的情况下,平均数、中位数与众数是_____的。如果 众数在左边、平均数在右边,称为 _____偏态。如果众数在右边、平均数在左边,则称为_____偏态。
21.采用分组资料,计算平均差的公式是_____,计算标准差的公式是_____。
二、单项选择题
1. 加权算术平均数的大小( )
A 受各组次数f的影响最大
B 受各组标志值x的影响最大
C 只受各组标志值x的影响
D 受各组次数f和各组标志值x的共同影响
2. 平均数反映了( )
A 总体分布的集中趋势
B 总体中总体单位分布的集中趋势
C 总体分布的离散趋势
D 总体变动的趋势
3. 在变量数列中,如果标志值较小的一组权数较大,则计算出来的算术平均数( )
A 接近于标志值大的一方
B 接近于标志值小的一方
C 不受权数的影响D 无法判断
4. 根据变量数列计算平均数时,在下列哪些情况下,加权算术平均数等于简单算术平均数( )
A 根据变量数列计算平均数时,在下列哪些情况下,加权算术平均数等于简单算术平均数( )
A 各组次数递增B 各组次数大致相同
C 各组次数相等 D 各组次数不相等
5. 已知某局所属12个工业企业的职工人数和工资总额,要求计算该局职工的平均工资,应该采用( )
A 简单算术平均法B 加权算术平均法
C 加权调和平均法D 几何平均法
6. 已知5个水果商店苹果的单价和销售额,要求计算5个商店苹果的平均单价,应该采用( )
A 简单算术平均数法B 加权算术平均法
C 加权调和平均法D 几何平均法
7. 计算平均数的基本要求是所要的平均数的总体单位应是( )
A 大量的B 同质的
C 差异的D 少量的
8. 某公司下属5个企业,已知每个企业某月产量计划完成百分比和实际产量,要求计算该公司平均计划完成程度,应采用加权调和平均数的方法计算,其权数是( )
A 计划产值B 实际产量
C 工人数D 企业数
9. 中位数和众数是一种( )
A 代表值B 常见值
C 典型值D 实际值
10. 有组距变量数列计算算术平均数时,用组中值代表组内标志值的一般水平,由一个假定条件,即( )
A 各组的次数必须相等
B 各组标志值必须相等
C各组标志值在本组内呈均匀分布
D 各组必须是封闭组
11. 四分位数实际上是一种( )
A 极差B 平均差
C 标准差D 标准差系数
12. 离中趋势指标中,最容易受极端值影响的是( )
A 极差B 平均差
C 标准差D 标准差系数
13. 平均差与标准差的主要区别在于( )
A 指标意义不同B 计算条件不同
C 计算结果不同D 数学处理方法不同
14. 某贸易公司到20个商店本年第一季度按商品销售额分组如下:
按商品销售额分组(万元)
商店个数(个)
则公司20个商店商品销售额的平均差为( )
A 7万元B 1万元
C 12万元D 3万元
15.已知某班40名学生,其中男、女学生各占一半,则该班学生性别成书方差为( )
A 25%B 30%C 40%D 50%
16、当数据组高度偏度时,哪一种平均数更具有代表性?( )
A 算术平均数B 中位数
C 众数D 几何平均数
17. 方差是数据中各变量值与其算术平均数的()
A离差绝对数的平均数B离差平方的平均数
C离差平均数的平方D离差平均数的绝对值
18一组数据的偏态系数为1.3,表明该组数据的分布是()
A正态分布B平顶分布C左偏分布D右偏分布
19.当一组数据属于左偏分布时,则()
A 平均数、中位数与众数是合二为一
B众数在左边、平均数在右边
C众数的数值较小,平均数的数值较大
D众数在右边、平均数在左边
20.四分位差排除了数列两端各()单位标志值的影响。
A10%B15%C25%D35%
三、多项选择题
1.在各种平均数中,不受急端值影响的平均数是(  )
A算术平均数     B调和平均数    C中位数 
D几何平均数     E众数
2加权算术平均数的大小受哪些因素的影响(  )
A受各组频数或频率的影响    B受各组标志值的影响 
C受各组标志值和权数的共同影响 D只受各组标志值大小的影响
3.平均数的作用是(  )
A反映总体的的一般水平
B对不同时间、不同地点、不同部门的同质总体平均数进行对比
C测定总体各单位的离散程度
D测定总体各单位分布的集中趋势
E反映总体的规模
4.众数是(  )
A位置平均数
B总体中出现次数最多的标志值
C不受极端值的影响
D适用于总体单位数多,有明显集中趋势的情况
E处于变量数列中点位置的那个标志值
5在什么条件下,加权算术平均数等于简单算术平均数(  )
A各组次数相等           B各组标志值不等 
C变量数列为组距变量数列      D各组数列为1  E各组次数占总次数的比重相等
6加权算术平均数的计算公式有(  )
A        B   C       D       E 
7计算和应用平均数的原则是(  )
A现象的同质性    B用组平均数补充说明总平均数
C用变量数列补充说明平均数     D用时间变量数列补充说明平均数
E把平均数和典型事例结合起来
8、下列变量数列中可以计算算术平均数的有(   )
A变量数列  B等距变量数列  C品质变量数列
D时间变量数列   E不等距变量数列 
9、几何平均数主要适用于(  )
A标志值的代数和等于标志值的总量的情况
B标志值的连乘积等于总比率的情况
C标志值的连乘积等于总速度的情况
D具有等比关系的变量数列
E求平均比率时
10、中位数数(   )
A由标志值在变量数列中所处的位置决定的
B根据标志值出现的次数决定的
C总体单位水平的平均值
D总体一般水平的代表值
E不受总体中极端数值的影响
11、有些离中趋势指标是用有名数表示的,它们是(    )
A极差  B平均差  C标准差  D平均差  E四位分差
12、不同总体间的标准差不能简单进行对比,是因为(   )
A平均数不一致  B标志差不一致   C计量单位不一致
D总体单位数不一致   E与平均数的离差之和不一致
13、不同数据组间各标志值的差异程度可以通过标准差系数进行比较,因为标准差系数(  )
A消除了不同数据组各标志值的计量单位的影响
B消除了不同数列平均数水平高低的影响
C消除了各标志值差异的影响
D数值的大小与数列的差异水平无关
E数值的大小与数列的平均数大小无关 
14、下列指标中,反映数据分布的对称、尖峭程度的指标有(  )
A标准差分位值  B偏度系数   C峰度系数    
D标准差系数   E标准差
15、若一组数据的偏度系数是-0.25,则下列说法正确的有(  )
A平均数、中位数与众数是分离的
B众数在左边、平均数在右边
C数据的极端值在右边,数据分配曲线向右延伸
D众数在右边、平均数在左边
E数据的极端值在左边,数据分配曲线向左延伸
16、若某个观察值的标准差分位值为-1.5,则下列说法正确的是(  )
A该观察值低于平均数   B该观察值高于平均数
C该观察值比该数据组的平均数低1.5个标准差
D该观察值比该数据组的平均数1.5个标准差
E该观察值比该数据组的平均数低1.5个单位
17、关于峰度系数,下列说法正确的有(   )
A当β=3时,次数分配曲线为正态分布曲线
B当β小于3时,为平顶曲线
C当β接近于1.8时,次数分布趋向一条水平线
D当β小于1.8时,次数分配曲线是ú型分配
E如果β的数值越大于3,则次数分配曲线的顶端越尖峭
18、关于极差,下列说法正确的是(  )
A只能说明变量值变异的范围
B不反映所有变量值差异值差异的大小
C最大的缺点是受极端值的影响
D最大的优点是不受极端值的影响
E反映数据的分配状况
19.下列指标中,反映数据组中所有数值变异大小的指标有(   )
A四分位差  B平均差  C极差   D标准差   E离散系数
四、判断题
1.权数对算术平均数的影响作用取决于权数本身绝对值的大小。()
2.算术平均数的大小,只受总体各单位标志值大小的影响。()
3.在特定条件下,加权算术平均数可以等于简单算术平均数。()
4。中位数和众数都属于算术平均数,因此它们数值的大小受到总体内各单位标志值大小的影响。( )
5。分位数都属于数值平均数。( )
6。在资料已分组时,形成变量数列的条件下,计算算术平均数或调和平均数时,应采用简单式;反之,采用加权式。( )
7。当各标志值的连乘积等于总比率或总速度时,宜采用几何平均法计算平均数。( )
8。众数是总体中出现最多的次数。( )
9。未知计算平均数的基本公式中的分子资料时,应采用加权算术平均数方法计算。( )
10。按人口平均的粮食产量是一个平均数。( )
11。变量数列的分布呈右偏分布时,算术平均数的值最小。( )
12。若数据组的均值是450,标准差为20,那么,所有的观察值都要在450+20、450―20的范围内。( )
13。是非标志的标准差是总体中两个成数的几何平均数。( )
14。总体中各标志值之间的差异程度越大,标准差系数就越小。( )
15。同一数列,同时计算平均差,标准差,二者必然相等。( )
16。如果两个数列的极差相同,那么,它们的离中程度就相同。( )
17。离中趋势指标既反映了数据组中各标志值的共性,又反映了它们之间的差异性。( )
18。若两组数据的平均数与标准差均相同,则其分布也是相同的。( )
19。在对称分布的条件下,高于平均数的离差之和与低于平均数的离差之和,必然相等,全部的离差之和一定等于0。( )
20。数据组中各个数值的大小相当接近时,它们的离差就相对小,数据组的标准差就相对小。( )
21。偏态系数与峰度系数的取值范围都是-3与+3之间。( )
五、简答题
1。反映总体集中趋势的指标有哪几种?集中趋势指标有什么特点和作用?
2。如何理解权数的意义?在什么情况下,应用简单算术平均数和加权算术平均数计算的结果是一致的?
3。加权算术平均数和加权调和平均数有何区别和联系?
4。平均数的计算原则是什么?
5。简述算术平均数、中位数、众数三者之间的关系?
6。什么是离中趋势指标?它有哪些作用?
7。离中趋势指标有哪些,它们之间有哪些区别?
8。如何对任意两个总体平均数的代表值进行比较?
9。什么是偏度?它有几种测定方法?
10。什么是峰度?它有几种类型?
六、计算题
1。某厂对三个车间一季度生产情况分析如下:
第一车间产际产量为190件,完成计划95%;第二车间实际产量250件,完成计划100%;第三车间实际产量609件,完成计划105%。三个车间产品产量的平均计划完成程度为:DDDDDDDDDD=100%。另外,一车间产品单位成本为18元/件,二车间产品单位成本为12元/件,三车间产品单位成本为15元/件,则三个车间平均单位成本为:DDDDDDDD=15元/件。
以上平均指标的计算是否正确?如不正确请说明理由并改正。
2。2001年某月份甲、乙两农贸市场某农产品价格和成交量、成交额资料如下:
价格(元/斤)
甲市场成交额(万元)
乙市场成交量(万斤)
试问哪一个市场农产品的平均价格高?并说明原因。
3。某厂生产某种机床配件,要经过三道生产工序,现生产一批该产品在各道生产工序上的合格率分别为95.74%、93.48%、97.23%。根据资料计算三道生产工序的平均合格率。
4。已知某企业有如下资料:
按计划完成百分比分组(%)
实际产值(万元)
计算该企业按计划完成百分比。
5。某市场有三种不同的苹果,其每斤价格分别为2元,3元,和4元,试计算:(1)各买一斤,平均每斤多少钱?(2)各买一元,平均每斤多少钱?
6。某高校某系学生的体重资料如下:
按体重分组(公斤)
学生人数(人)
试根据所给资料计算学生体重的算术平均数、中位数、众数。
7。已知某公司职工的月工资收入为965元的人数最多,其中,位于全公司职工月工资收入中间位置的职工的月工资收入为932元,试根据资料计算出全公司职工的月平均工资。并指出该公司职工月工资收入变量数列属于何种偏态?
8。对成年组和幼儿组共500人身高资料分组,分组资料列表如下:
按身高分组(cm)
人数(人)
按身高分组(cm)
人数(人)
要求:(1)分别计算成年组和幼儿组身高的平均数、标准差和标准差系数。
(2)说明成年组和幼儿组平均身高的代表性哪个大?为什么?
9。当每天生产线的每小时产量低于平均每小时产量,并落入大于2个标准差时,该生产线被认为是“失去控制”。对该生产线来说,昨天平均每小时产量是370件,其标准差每小时为5件。下面是该天头几个小时的产量,该生产线在什么时候失去了控制?
10。你是定时器的购买者,定时器在新道路爆破中用来起爆炸药。你必须在两个供应者之间选择,分别用A和B表示。在各自的说明书中,你发现由A出售的导火线引爆的平均时间时间为30秒,其标准差为0.5秒;而由B出售的导火线引爆的平均时间为30秒,其标准差为6秒。请你做出选择,并说明原因。
11 。雇员要进行两项能力测试。在A项测试中,其测试中,其平均分为100分,标准差为15分;在B项测试中,其平均分为400分,标准差为50分。李明在A项测试中得了115分,在B测试中得了425分。与平均分相比,李明的哪一项测试个为理想?请通过计算李明的没项测试的标准差分位值来寻求答案。

我要回帖

更多关于 正态分布 均值 方差 的文章

 

随机推荐