如果某事件是标准正态分布函数,它应该应该满足什么条件? 具体事物说明。

统计学名词解释:总体 样本 方差 标准差 标准误 变异系数 抽样 总体参数 样本统计量 正态分布 t分布 F分布_百度知道
统计学名词解释:总体 样本 方差 标准差 标准误 变异系数 抽样 总体参数 样本统计量 正态分布 t分布 F分布
提问者采纳
1.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。2.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。3.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。4.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为 +、++、+++等。等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。5.概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。6. 随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。7.系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。8.随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。随机量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。9.参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。10.统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。11.频数表(frequency table)用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2…个病人的天数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。12.算术均数(arithmetic mean)描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X 表示。13.几何均数(geometric mean)用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。14.中位数(median)Md将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。反映一批观察值在位次上的平均水平。15.极差(range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。16.百分位数(percentile)是将n 个观察值从小到大依次排列,再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范围。17.四分位数间距(inter-quartile range)是由第3 四分位数和第1 四分位数相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。18.方差(variance):方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。19.标准差(standard deviation)是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。20.变异系数(coefficient of variation)用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。用CV 表示。计算:标准差/均数*100% 21.统计推断:通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程称为统计推断(statistical inference)。22.抽样误差:由个体变异产生的,抽样造成的样本统计量与总体参数的差异,称为抽样误差(sampling error)。23.标准误及X s :通常将样本统计量的标准差称为标准误。许多样本均数的标准差X s称为均数的标准误(standard error of mean,SEM ),它反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的大小。24.可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间(confidence interval,CI)。它的确切含义是:可信区间包含总体参数的可能性是1- α ,而不是总体参数落在该范围的可能性为1-α 。25.参数估计:指用样本指标值(统计量)估计总体指标值(参数)。参数估计有两种方法:点估计和区间估计。26.假设检验中P 的含义:指从H0 规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。27.I 型和II 型错误:I 型错误(type I error ),指拒绝了实际上成立的H0,这类“弃真”的错误称为I 型错误,其概率大小用α表示;II 型错误(type II error),指接受了实际上不成立的H0,这类“存伪”的误称为II 型错误,其概率大小用β表示。28.检验效能:1- β称为检验效能(power of test),它是指当两总体确有差别,按规定的检验水准a 所能发现该差异的能力。29.检验水准:是预先规定的,当假设检验结果拒绝H0,接受H1,下“有差别”的结论时犯错误的概率称为检验水准(level of a test),记为α 。 30..率(rate)又称频率指标,说明一定时期内某现象发生的频率或强度。计算公式为:发生某现象的观察单位数/可能发生某现象的观察单位总数*100%,表示方式有:百分率(%)、千分率(‰)等。31.构成比(proportion)又称构成指标,说明某一事物内部各组成部分所占的比重或分布。计算公式为:某一组成部分的观察单位数/同一事物各组成部分的观察单位总数*100%,表示方式有:百分数等。32.比(ratio)又称相对比,是A、B 两个有关指标之比,说明A 是B 的若干倍或百分之几。计算公式为:A/B ,表示方式有:倍数或分数等。 33.非参数统计:针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题的一种不依赖总体分布的具体形式的统计分析方法。由于这类方法不受总体参数的限制,故称非参数统计法(non-parametric statistics),或称为不拘分布(distribution-free statistics)的统计分析方法,又称为无分布型式假定(assumption free statistics)的统计分析方法。34.参数统计:通常要求样本来自总体分布型是已知的(如正态分布),在这种假设的基础上,对总体参数(如总体均数)进行估计和检验,称为参数统计(parametric statistics)35.秩次:变量值按照从小到大顺序所编的秩序号称为秩次(rank)。36.秩和:各组秩次的合计称为秩和(rank sum),是非参数检验的基本统计量。37.直线回归(linear regression)建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种,故又称简单回归(simple regression)。38.回归系数(regression coefficient )即直线的斜率(slope),在直线回归方程中用b 表示,b 的统计意义为X每增(减)一个单位时,Y平均改变b 个单位。39.相关系数r:用以描述两个随机变量之间线性相关关系的密切程度与相关方向的统计指标。
提问者评价
太感谢你了,如久旱遇甘雨啊!
其他类似问题
样本统计量的相关知识
您可能关注的推广回答者:
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁新浪广告共享计划>
广告共享计划
2010年心理学考研预测——心理统计学
&& 一:正态分布与标准正态分布
  正态分布是常态分布或常态分配,是连续随机变量概率分布的一种,自然界、人类社会、心理和教育中大量现象均按正态形式分布,例如能力的高低,学
生成绩的好坏等都属于正态分布。它的特点是:正态分布的形式是对称的,对称轴是经过平均数点的垂线。中央点最高,然后逐渐向两侧下降,曲线的形式是先向内
弯,再向外弯。曲线下的面积为1。
  标准正态分布是正态分布的一种,平均数为0,标准差为1。
  区别:正态分布是一族分布,它随随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。标准正态分布的平均数和标准差都是固定的。
  联系:标准正态分布是正态分布的一种,具有正态分布的所有特征。所有正态分布都可以通过Z分数公式转换成标准正态分布。
  二:卡方分布
  卡方分布
(χ2分布)是统计学中的一种机率分布,它广泛的运用于检测数学模型是否适合所得的数据,以及数据间的相关性。数据并不需要呈常态分布。
  三:区间估计
  推断统计的结论没有100%的准确,只能以一定的概率,即“小概率事件发生与否”作判断,而判断的准确性需要用一个区间来表示,根据区间估计的公式就可以计算出分值的范围。
  四:积差相关
  英国著名统计学家皮尔逊跟随英国著名科学家高尔顿(F
Galton)在合作研究有关人类身高遗传问题的过程中,提出了“回归”的概念以及积差相关分析方法。
  对于两个连续的变量(比率变量或等距变量),例如父辈的身高变量和子辈的身高变量之间有什么连带关系;学生的体重与身高变量之间有什么连带关
系;不同学科成绩之间有什么样的相互关联;人的智力发展水平同学业成就之间相关程度如何等等,通过观测研究,可以用积差相关分析的方法,定量地描述两个变
量之间的相关强度与方向。
  五:相关系数
  相关系数是指两个变量之间相关的程度,但是相关无法说明二者之间是否存在因果关系。相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度。
  当r&0时,表示两变量正相关,r&0时,两变量为负相关。
  当|r|=1时,表示两变量为完全线性相关,即为函数关系。
  当r=0时,表示两变量间无线性相关关系。
  当0&|r|&1时,表示两变量存在一定程度的线性相关。且|r|越接近1,两变量间线性关系越密切;|r|越接近于0,表示两变量的线性相关越弱。
  六:方差齐性检验
  F= S2max/S2mix,最大方差S2max,最小方差S2mix
  计算自由度
  查表F0.05
F0.05,则方差齐性。&&&
  七:方差分析的原理
  方差分析需要满足的前提条件有总体正态分布;各处理方差齐性。
  八:重复测量的方差分析
  重复测量的方差分析指的是一个应变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。
  九:回归系数在回归方程中表示自变量x
对因变量y 影响大小的参数。回归系数越大表示x 对y 影响越大,正回归系数表示y 随x 增大而增大,负回归系数表示y 随x
增大而减小。回归方程式^Y=bX+a中之斜率b,称为回归系数,表X每变动一单位,平均而言,Y将变动b单位。
&& 十:折线图
  折线图可以显示随时间(根据常用比例设置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势。在折线图中,类别数据沿水平轴均匀分布,所有值数据沿垂直轴均匀分布。
  如果分类标签是文本并且代表均匀分布的数值(如月、季度或财政年度),则应该使用折线图。当有多个系列时,尤其适合使用折线图 —
对于一个系列,应该考虑使用类别图。
  十一:散点图
  散点图是用平面直角坐标系上的点的散布图形来表示两种事物之间的相关性及联系模式,适用于描述二元变量的观测数据。
  直方图是由若干宽度相等、高度不等的直方条紧密排列在同一基线上构成的图形;线形图是以起伏的折线来表示某种事物的发展变化趋势及演变趋势的统
计图,适用于描述某种事物在时间序列上的变化趋势,也适用于描述一种事物随另一事物发展变化的趋势模式,还可以适用于比较不同的人物团体在同一心理或教育
现象上的变化特征及相互联系;条形图是用宽度相同的长条来表示各个统计事项之间的数量关系,通常应用描述离散性变量的统计事项。
  十二:集中量数(平均数、中数、众数)
  平均数是用以度量连续变量次数分布集中趋势最常用的集中量数,其计算公式就是将所有的数据相加,再用数据的个数去除数据的总和。
  众数是指次数分布中出现次数最多的那个数的数值。
  中数,一组数据按照由大到小或则会由小到大的顺序排列,位于中间的数字。
  十三:差异量数
  差异量数包括平均差、方差与标准差、四分位差、全距、百分位差等。
  百分等级分数是一种相对地位量数,它根据分布中某一原始分数,求这个原始分数在分布中所处的相对位置——百分等级,作为经常使用的一种测验分数,对分数解释有较大的意义。
  全距又称两极差,是把一组数据按从小到大的顺序排序,用最大值减去最小值,是说明离散程度的最简单的统计量。
  方差是各变量值与其算术平均数离差平方的算术平均数。标准差是方差的平方根。
  变异系数又称“标准差率”,是衡量资料中各观测值变异程度的另一个统计量。当进行两个或多个资料变异程度的比较时,如果度量单位与平均数相同,
可以直接利用标准差来比较。如果单位和(或)平均数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较。标准差与平
均数的比值称为变异系数,记为C/V。变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。标准变异系数是一组数据的变异指标与
其平均指标之比,它是一个相对变异指标。
  十四:数据类型
  称名量表是又称类别量表,是以受试对象的类别方式记分。如以男女分类编码记分,以干部职工身份分类等。
  顺序量表,即要求评定人在若干个备择项目中按照一定标准排出等级次序。该种量表既没有相等单位,又没有绝对零度。例如,在对媒介栏目的测评中,要求按照自己对于几种备择栏目的偏爱程度排出先后顺序。
  等距量表是一种有相同单位但没有绝对零点的量表,它只能做加减运算,不能做乘除运算。没有绝对零点,也没有相同单位的量表为顺序量表;有绝对零点和相同单位的
  等比量表,比等距量表更进了一步,既有绝对零,又有相等单位,因而属于最高测量水平。
   十五:标准分数
  标准分数又称为Z分数或真分数,是原始数据与平均数之差除以标准差所得到的一种分数,是以标准差为单位表示一个分数在团体中所处的相对位置的量数。用公式表示为
  Z=(X-U)/S& 其中,S为标准差, X为原始数据,U 为平均数。
  Z分数是原始数据与平均数之差除以标准差所得的商,无实际单位。如果原始数据大于平均数则Z值为正;如果原始数据小于平均数则其Z值为负;如果原始数据等于平均数则Z值为零。
  标准分数的性质:
标准分数的分布与原始数据的分布相同。任何一组数据的标准分数的标准差为1。&&
当总体都服从同一分布时,总体的标准分数之间具有可比性。用标准分数表示的样本间可以进行算术运算。
   十六:抽样的基本原则
  抽样方法有单纯随机抽样、系统抽样、分层抽样、整群抽样和多级抽样。在现况调查中,后三种方法较常用。
  单纯随机抽样:这种方法的基本原则是每个抽样单元被抽中选入样本的机会是相等的。简便、易行的科学分组方法是利用随机数字表。抽签、抓阄的方法
严格地说不能达到完全随机化,但因其简单、实用,小范围的抽样仍可使用。简单随机抽样首先要有一份所有研究对象排列成序的编号名单,再用随机的方法选出进
入样本的号码,已经入选的号码一般不能再次列入,直至达到预定的样本含量为止。单纯随机抽样的优点是简便易行。其缺点是在抽样范围较大时,工作量太大难以
采用;以及抽样比例较小而样本含量较小时,所得样本代表性差。
  系统抽样:此法是按照一定顺序,机械地每隔一定数量的单位抽取一个单位进入样本。每次抽样的起点必须是随机的,这样系统抽样才是一种随机抽样的
方法。例如,拟选一个5%的样本(即抽样比为1/20),可先从1~20间随机选一个数,设为14,这就是选出的起点,再加上20,得34,34加20得
54,……。这样,14,34,54,74,94就是第一个100号中入选的数字,以后依次类推。系统抽样代表性较好,但必须事先对总体的结构有所了解才
能恰当地应用。
  分层抽样:这是从分布不均匀的研究人群中抽取有代表性样本的方法。先按照某些人口学特征或某些标志(如年龄、性别、住址、职业、教育程度、民族
等)将研究人群分为若干组(统计学上称为层),然后从每层抽取一个随机样本。分层抽样又分为两类:一类叫按比例分配分层随机抽样,即各层内抽样比例相同;
另一类叫最优分配分层随机抽样,即各层抽样比例不同,内部变异小的层抽样比例小,内部变异大的层抽样比例大,此时获得的样本均数或样本率的方差最小。分层
抽样要求层内变异越小越好,层间变异越大越好,因而可以提高每层的精确度,而且便于层间进行比较。
  整群抽样:抽样单位不是个体而是群体,如居民区、班级、连队、乡、村、县、工厂、学校等。然后用以上几种方法从相同类型的群体中随机抽样。抽到
的样本包括若干个群体,对群体内所有个体均给以调查。群内个体数可以相等,也可以不等。这种方法的优点是,在实际工作中易为群众所接受,抽样和调查均比较
方便,还可节约人力、物力和时间,因而适于大规模调查。但整群抽样要求群间的变异越小越好,否则抽样误差较大,不能提供总体的可靠信息。
  十七:假设检验的原理(两类错误)
  假设检验的原理和方法是由样本推断总体,由于总体的真实情况往往是未知的,根据样本推断总体就有可能犯两类错误:虚无假设H。本来是正确的,但
拒绝了H。,这类错误称为弃真错误,即仅型错误,也称I错误;虚无假设H。本来不正确,但却接受了H。,这类错误称为取伪错误,即B型错误,也称Ⅱ错误。
但没有H。型错误和H。型错误的说法。
  十八:统计检验力在假设检验中,通常用来表示统计检验力用1-β表示。
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。正态分布 -
正态分布正态分布(Normal&distribution)是一种分布。正态分布是具有两个参数μ和σ2的连续型随机变量的分布,第一参数μ是遵从正态分布的随机变量的均值,第二个参数σ2是此随机变量的方差,所以正态分布记作N(μ,σ2&)。遵从正态分布的随机变量的概率规律为取&μ邻近的值的概率大&,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。
正态分布的的特点是:关于μ对称,在μ处达到最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点。它的形状是中间高两边低&,图像是一条位于x&轴上方的钟形曲线。当μ=0,σ2&=1时,称为标准正态分布,记为N(0,1)。
μ维随机向量具有类似的概率规律时,称此随机向量遵从。多元正态分布有很好的性质,例如,多元正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。
正态分布 -
正态分布应用最广泛的连续分布,其特征是“钟”形曲线。附:这种分布的概率密度函数为:正态分布若已知的密度函数(频率曲线)为正态函数(曲线)则称已知曲线服从正态分布,记号&~。其中μ、σ^2&是两个不确定常数,是正态分布的参数,不同的μ、不同的σ^2对应不同的正态分布。正态曲线呈钟型,两头低,中间高,左右对称,曲线与横轴间的面积总等于1。标准正态曲线标准正态曲线N(0,1)是一种特殊的正态分布曲线,以及标准正态总体在任一区间(a,b)内取值概率。1.标准正态分布是一种特殊的正态分布,标准正态分布的μ和σ^2为0和1,通常用ξ(或Z)表示服从标准正态分布的变量,记为&Z~N(0,1)。2.标准化变换:此变换有特性:若原分布服从正态分布&,则Z=(x-μ)/σ&~&N(0,1)&就服从标准正态分布,通过查标准正态分布表就可以直接计算出原正态分布的概率值。故该变换被称为标准化变换。 ⒊&标准正态分布表:标准正态分布表中列出了标准正态曲线下从-∞到X(当前值)范围内的面积比例。“小概率事件”和假设检验的基本思想&“小概率事件”通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。这种认识便是进行推断的出发点。关于这一点我们要有以下两个方面的认识:一是这里的“几乎不可能发生”是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事件几乎不可能发生的原理”进行推断时,我们也有5%的犯错误的可能。面积分布1.实际工作中,正态曲线下横轴上一定区间的面积反映该区间的例数占总例数的百分比,或变量值落在该区间的概率(概率分布)。不同&范围内正态曲线下的面积可用公式计算。⒉几个重要的面积比例 轴与正态曲线之间的面积恒等于1。正态曲线下,横轴区间(μ-σ,μ+σ)内的面积为68.268949%,横轴区间(μ-1.96σ,μ+1.96σ)内的面积为95.449974%,横轴区间(μ-2.58σ,μ+2.58σ)内的面积为99.730020%。两种正态分布&一般正态分布与标准正态分布的转化由于正态分布一般的正态总体其图像不一定关于y轴对称,对于任一正态总体&,其取值小于x的概率。只要会用它求正态总体&在某个特定区间的概率即可。“小概率事件”和假设检验的基本思想“小概率事件”通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。这种认识便是进行推断的出发点。关于这一点我们要有以下两个方面的认识:一是这里的“几乎不可能发生”是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事件几乎不可能发生的原理”进行推断时,我们也有5%的犯错误的可能。一般正态分布与标准正态分布的区别与联系正态分布也叫常态分布,是连续随机变量概率分布的一种,自然界、人类社会、心理和教育中大量现象均按正态形式分布,例如能力的高低,学生成绩的好坏等都属于正态分布。标准正态分布是正态分布的一种,具有正态分布的所有特征。所有正态分布都可以通过Z分数公式转换成标准正态分布。两者特点比较:⑴正态分布的形式是对称的,对称轴是经过平均数点的垂线。⑵中央点最高,然后逐渐向两侧下降,曲线的形式是先向内弯,再向外弯。⑶正态曲线下的面积为1。正态分布是一族分布,它随随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。标准正态分布是正态分布的一种,其平均数和标准差都是固定的,平均数为0,标准差为1。⑷正态分布曲线下标准差与概率面积有固定数量关系。所有正态分布都可以通过Z分数公式转换成标准正态分布。主要特征1.集中性:正态曲线的高峰位于正中央,即均数所在的位置。2.对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。3.均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。4.正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平。5. u变换:为了便于描述和应用,常将正态变量作数据转换。μ是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以X=μ为对称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于μ。 6. 3σ原则:3σ原则:P(μ-σ&X≤μ+σ)=68.3%P(μ-2σ&X≤μ+2σ)=95.4%P(μ-3σ&X≤μ+3σ)=99.7%。σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。曲线性质1.当x正态分布&;μ时,曲线上升;当x&;μ时,曲线下降。当曲线向左右两边无限延伸时,以x轴为渐近线。2.正态曲线关于直线x=μ对称。3.σ越大,正态曲线越扁平;σ越小,正态曲线越尖陡。4.在正态曲线下方和x轴上方范围内区域面积为1。
正态分布 -
正态分布是最重要的一种概率分布。正态分布概念是由的数学家和天文学家于1733年首次提出的,但由于德国数学家率先将其应用于天文学家研究,故正态分布又叫高斯分布,高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。高斯是一个伟大的数学家,重要的贡献不胜枚举。但现今德国10马克的印有高斯头像的钞票,其上还印有正态分布的密度曲线。这传达了正态分布一种想法:在高斯的一切科学贡献中,其对人类文明影响最大者,就是这一项。在高斯刚作出这个发现之初,也许人们还只能从其理论的简化上来评价其优越性,其全部影响还不能充分看出来。这要到20世纪正态小样本理论充分发展起来以后。很快得知高斯的工作,并马上将其与他发现的中心极限定理联系起来,为此,他在即将发表的一篇文章(发表于1810年)上加上了一点补充,指出如若误差可看成许多量的叠加,根据他的中心极限定理,误差理应有高斯分布。这是历史上第一次提到所谓“元误差学说”——误差是由大量的、由种种原因产生的元误差叠加而成。后来到1837年,(G.Hagen)在一篇论文中正式提出了这个学说。其实,他提出的形式有相当大的局限性:把误差设想成个数很多的、独立同分布的“元误差”&之和,每只取两值,其概率都是1/2,由此出发,按狄莫佛的中心极限定理,立即就得出误差(近似地)服从正态分布。拉普拉斯所指出的这一点有重大的意义,在于他给误差的正态理论一个更自然合理、更令人信服的解释。因为,的说法有一点循环论证的气味:由于算术平均是优良的,推出误差必须服从正态分布;反过来,由后一结论又推出算术平均及最小二乘估计的优良性,故必须认定这二者之一(算术平均的,误差的)&为出发点。但算术平均到底并没有自行成立的理由,以它作为理论中一个预设的出发点,终觉有其不足之处。拉普拉斯的理论把这断裂的一环连接起来,使之成为一个和谐的整体,实有着极重大的意义。
正态分布 -
⒈&估计频数分布&一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内。
⒉&制定参考值范围
⑴正态分布法&适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。
⑵百分位数法&常用于偏态分布的指标。表3-1中两种方法的单双侧界值都应熟练掌握。
⒊&质量控制:为了控制实验中的测量(或实验)误差,常以&作为上、下,以&作为上、下控制值。这样做的依据是:正常情况下测量(或实验)误差服从正态分布。
⒋&正态分布是许多统计方法的理论基础。检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。频数分布例1.10&某地1993年抽样调查了100名18岁男身高(cm),其均数=172.70cm,标准差s=4.01cm,①估计该地18岁男大学生身高在168cm以下者占该地18岁男大学生总数的百分数;②分别求X+-1s、X+-1.96s、X+-2.58s范围内18岁男大学生占该地18岁男大学生总数的实际百分数,并与理论百分数比较。
本例,μ、σ未知但样本含量n较大,按式(3.1)用样本X和S分别代替μ和σ,求得u值,u=(168-172.70)/4.01=-1.17。查附表标准正态曲线下的面积,在表的左侧找到-1.1,表的上方找到0.07,两者相交处为0.%。该地18岁男大学生身高在168cm以下者,约占总数12.10%。其它计算结果见表3。表3&100名18岁男大学生身高的实际分布与理论分布分布(x+-s)&&身高范围(cm)& &&实际分布人数&&实际分布百分数(%)&&理论分布(%)&&X+-1s&&168.69~176.71&&67&&67.00&&&68.27&&X&+-1.96s&&164.84~180.56&&95&&95.00&&95.00&&X+-2.58s&&162.35~183.05&&99 &99.00&&&99.00&&&医学参考值
某些现象,如同质群体的身高、红细胞数、血红蛋白量,以及实验中的随机误差,呈现为正态或近似正态分布;有些指标(变量)虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理。其中经对数转换后服从正态分布的指标,被称为服从对数正态分布。
医学参考值范围亦称医学正常值范围。它是指所谓“正常人”的、、生化等指标的波动范围。制定正常值范围时,首先要确定一批样本含量足够大的“正常人”,所谓“正常人”不是指“健康人”,而是指排除了影响所研究指标的疾病和有关因素的同质人群;其次需根据研究目的和使用要求选定适当的百分界值,如80%,90%,95%和99%,常用95%;根据指标的实际用途确定单侧或双侧界值,如计数过高过低皆属不正常须确定双侧界值,又如肝功中过高属不正常须确定单侧上界,过低属不正常须确定单侧下界。另外,还要根据资料的分布特点,选用恰当的计算方法。常用方法有:
⑴正态分布法:适用于正态或近似正态分布的资料。
双侧界值:X+-u(u)^S单侧上界:X+u(u)^S,或单侧下界:X-u(u)^S
⑵对数正态分布法:适用于对数正态分布资料。
双侧界值:lg-1[X(lgx)+-u(u)S(lgx)];单侧上界:lg-1[X(lgx)+u(u)S(lgx)],或单侧下界:lg-1[X(lgx)-u(u)S(lgx)]。常用u值可根据要求由表4查出。
⑶百分位数法:常用于偏态分布资料以及资料中一端或两端无确切数值的资料。
双侧界值:P2.5和P97.5;单侧上界:P95,或单侧下界:P5。表4常用u值表 参考值范围(%)&&单侧&&双侧&&80&&0.842&&1.282&&90&&1.282&&1.645&&95&&1.645&&1.960&&99&&2.326&&2.576&&理论基础
如t分布、F分布、分布都是在正态分布的基础上推导出来的,u检验也是以正态分布为基础的。此外,t分布、二项分布、Poisson分布的极限为正态分布,在一定条件下,可以按正态分布原理来处理。
概率论中最重要的分布
正态分布有极其广泛的实际背景,生产与科学实验中很多的分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体的,等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理)。从理论上看,正态分布具有很多良好的性质&,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。
在联系自然、社会和思维的实践背景下,我们以正态分布的本质为基础,以正态分布曲线及面积分布图为表征(以后谈及正态分布及正态分布论就要浮现此图),进行抽象与提升,抓住其中的主要哲学内涵,归纳正态分布论()的主要内涵如下:
正态分布启示我们,要用整体的观点来看事物。“的整体观念或总体观念是系统概念的精髓。”&正态分布曲线及面积分布图由基区、负区、正区三个区组成,各区比重不一样。用整体来看事物才能看清楚事物的本来面貌,才能得出事物的根本特性。不能只见树木不见森林,也不能以偏概全。此外整体大于部分之和正态分布,在分析各部分、各层次的基础上,还要从整体看事物,这是因为整体有不同于各部分的特点。用整体观来看世界,就是要立足在基区,放眼负区和正区。要看到主要方面,还要看到次要方面,既要看到积极的方面还要看到事物消极的一面,看到事物前进的一面还要看到落后的一面。片面看事物必然看到的是偏态或者是变态的事物,不是真实的事物本身。
正态分布曲线及面积分布图非常清晰的展示了重点,那就是占68.27%,是主体,要重点抓,此外95%,99%则展示了正态的全面性。认识世界和改造世界一定要住住重点,因为重点就是事物的主要矛盾,它对事物的发展起主要的、支配性的作用。抓住了重点才能一举其纲,万目皆张。事物和现象纷繁复杂,在千头万绪中不抓住,就会陷入无限琐碎之中。由于我们时间和精力的相对有限性,出于效率的追求,我们更应该抓住重点。在正态分布中,基区占了主体和重点。如果我们结合20/80法则,我们更可以大胆的把正区也可以看做是重点。
联系和发展是事物发展变化的基本规律。任何事物都有其产生、和的历史,如果我们把正态分布看做是任何一个系统或者事物的发展过程的话,我们明显的看到这个过程经历着从负区到基区再到正区的过程。无论是自然、社会还是人类的思维都明显的遵循这这样一个过程。准确的把握事物或者事件所处的历史过程和阶段极大的有助于掌握我们对事物、事件的特征和性质,是我们分析问题,采取对策和解决问题的重要基础和依据。发展的阶段不同,性质和特征也不同,分析和解决问题的办法要与此相适应,这就是具体问题具体分析,也是解放思想、实事求是、与时俱乐进的精髓。正态发展的特点还启示我们,事物发展大都是渐进的和累积的,走渐进发展的道路是事物发展的。例如,遗传是常态,变异是。
总之,正态分布论是科学的世界观,也是科学的方法论,是我们认识和改造世界的最重要和最根本的工具之一,对我们的理论和实践有重要的指导意义。以正态哲学认识世界,能更好的认识和把握世界的本质和规律,以正态哲学来改造世界,能更好的在尊重和利用客观规律,更有效的改造世界。统计规律表明,的智力水平,包括学习能力,实际动手能力等呈正态分布。因而正常的考试成绩分布应基本服从正态分布。考试分析要求绘制出学生成绩分布的直方图,以“中间高、两头低”来衡量成绩符合正态分布的程度。其评价标准认为:考生成绩分布情况直方图,基本呈正态曲线状,属于好,如果略呈正(负)态状,属于中等,如果呈严重偏态或无规律,就是差的。
生产与中很多随机变量的概率分布都可以近似地用正态分布来描述。从概率统计规律看,“正常的考试成绩分布应基本服从正态分布”是正确的。但是必须考虑人与物的本质不同,以及教育的有所作为可以使“随机”受到干预,用曲线或直方图的形状来评价考试成绩就有失偏颇。现在许多教育专家(如上海&、美国等)已经通过实践论证,教育是可以大有作为的,可以做到大多数学生及格,而且多数学生可以得高分,考试成绩曲线是偏正态分布的。但是长期受到“中间高、两头低”标准的影响,限制了教师的作为,抑制了多数学生能够学好的信心。这是很大的误会。
通常正态曲线有一条对称轴。当某个分数(或分数段)的考生人数最多时,对应曲线的最高点,是曲线的顶点。该分数值在横轴上的对应点与顶点连接的线段就是该正态曲线的对称轴。考生人数最多的值是峰值。我们注意到,成绩曲线或直方图实际上很少对称的,称之为峰线更合适。
弗朗西斯&&[Francis&Galton&-],探险家、家、家,差异心理学之父,也是心理测量学上生理计量法的创始人。
高而顿对心理学的贡献,大概可以归纳未差异心理学、心理测量的量化和实验心理学三方面:
⒈他率先研究个体差异。他在南肯辛顿博物馆他的人类测量实验室内,利用仪器作人类学测量及心理测量。测量项目有身高、体重、肺活量、拉力和握力、扣击的速率、听力、视力、色觉等,以研究能力的个体差异。又用问答法研究意象的个体差异。要求被试先确定一件事,如早餐的情境,然后被试回忆心目中出现餐桌上实物的意象,即食物的鲜明度、确定度等。对答案整理后,他发现被试的意象有很大的个体差异:有的人以肌肉运动觉意象为主,有的人以听觉意象为主,有的人以视觉意象为主。
他强调是形成个体差异的原因。他通过谱系调查,论证遗传因素与个体差异的关系。他是第一个明确提出普通能力和特殊能力主张的人。他在调查&&年这&1OO&年间英国的、、和共&977&名获得智力成熟的人的家谱后发现,其中有&89&个父亲、129&个儿子、114&个兄弟,共&332&名杰出人士。而在一般老百姓中&4000&人才产生一名杰出人士。因此断言“普通能力”是遗传的。在调查&30&家有艺术能力的家庭中,他发现这些家庭中的子女也有艺术能力的占&64%;而&15O&家无艺术能力的家庭,其子女中只有&21%&有艺术能力,因此断言艺术能力&-&“特殊能力”也是遗传的。他发现,遗传亲属关系程度的降低,杰出亲属的比例也显著地下降。他还用&80&对双生子的资料,以双生子比其他亲兄弟、亲姐妹在心理特点上更为相像的事例,证明人的心理完全是遗传的。由此也使他第一个注意到同卵双生和异卵双生在估计遗传和环境因素在人的变异方面的相对作用的方法论的重要性。高尔顿根据遗传与个体差异的关系倡导善择配偶,改良人种,并再&1883&年《》一书中首创“优生学”这一术语。
⒉心理学研究之量化,始自。他发明了许多感官和运动的测试,并以数量代表所测得的心理特质之差异。他认为人的所有特质,不管是物质的还是精神的,最终都可以定量叙述,这是实现人类科学的必要条件,故最先应用统计法处理心理学研究资料,重视数据的平均数与高中差数。他收集了大量资料证明人的心理特质在人口中的分布如同身高、体重那样符合正态分布曲线。他在论及遗传对个体差异的影响时,为相关系数的概念作了初步提示。如他研究了“居间亲”和其成年子女的身高关系,发现居间亲和其子女的身高有正相关,即父母的身材较高,其子女的身材也有较高的趋势。反之,父母的身材较低,其子女也有较矮的趋势。同时发现子女的身高常与其父母略有差别,而呈现“回中”趋势,即离开其父母的身高数,而回到一般人身高的平均数。
⒊1883&年,高尔顿出版了《人类才能及其发展的研究》,书中概括地表述了两项在实验心理学中极为重要的研究方法和成果。第一个是关于自由联想的实验:他事先在&75&张纸条上各写一个单词,每次只让受试者看一张纸条,再用一个精密的计时器测出由此引出的两个即兴到来的联想所需的时间,然后对这些联想在受试者的经验中的可能起源加以分析,他发现最经常的联想往往来自遥远的童年。在这项实验中,他还证实人类具有一种看到或听到某一数字就能联想到某一特定形状的能力,他称这种现象为“数目形”。第二个是关于的广泛调查:他要求受试者先想一件确定的东西,然后尽量注意自己的“心视”画面,并回答如明亮度,清晰度、色彩等一系列问题,并按其强度记分。值得一提的是,在这些研究中,他首先在心理学中引进了调查表和评分办法。他对实验心理学的贡献还包括一系列他所发明的和测验方法。有些仪器后来就以他的名字来命名,例如测量听觉阈的高尔顿笛和测量视觉范围的高尔顿棒,这些仪器直到&20&世纪&30&年代都是心理实验室的标准仪器。他还用盛有不同物质的瓶子来测验嗅觉,这一方法被后人沿用至今。除此之外,他又设计了测量肌肉感觉、反应力、触觉的仪器和方法。 
注:美国心理学家(L.&M.&Terman)曾根据有关文献的记载,用他自己设计的&-&比纳标准对幼年的高尔顿的智力进行了估算,他认为高尔顿&3-8&岁间的智力年龄几乎等于实际年龄的&2&倍,其智商约为&200。
智力、能力 [(Richard&J.&Herrnstein&-),美国(Charles&Murray)合著《正态曲线》一书而闻名,在该书中他们指出人们的智力呈正态分布。智力主要是遗传的并因种族的不同而不同,犹太人、东亚人的智商最高,其次为白人,表现最差的是黑人、西班牙裔人。他们检讨了数十年来心理计量学与政策学的研究成果,发现美国社会轻忽了智商的影响愈变愈大的趋势。他们力图证明,美国现行的偏向于以非洲裔和南美裔为主的低收入阶层的社会政策,如职业培训、大学教育等,完全是在浪费资源。他们利用应募入伍者的测试结果证明,黑人青年的智力低于白人和黄种人;而且,这些人的智力已经定型,对他们进行培训收效甚微。因此,政府应该放弃对这部分人的教育,把钱用于包括所有种族在内的启蒙教育,因为孩子的智力尚未定型,开发潜力大。由于此书涉及的智力问题,一经出版便受到来自四面八方的围攻。&&&&
万方数据期刊论文
系统工程理论与实践
万方数据期刊论文
控制与决策
万方数据期刊论文
系统工程理论与实践
为本词条添加和相关影像
互动百科的词条(含所附图片)系由网友上传,如果涉嫌侵权,请与客服联系,我们将按照法律之相关规定及时进行处理。未经许可,禁止商业网站等复制、抓取本站内容;合理使用者,请注明来源于。
登录后使用互动百科的服务,将会得到个性化的提示和帮助,还有机会和770多万专业认证智愿者沟通。
您也可以使用以下网站账号登录:
此词条还可添加&
编辑次数:52次
参与编辑人数:24位
最近更新时间: 12:15:11
贡献光荣榜
扫描二维码用手机浏览词条
保存二维码可印刷到宣传品
扫描二维码用手机浏览词条
保存二维码可印刷到宣传品

我要回帖

更多关于 正态分布函数 的文章

 

随机推荐