怎么用excel求方差区间中点

运用Excel计算偏斜分布任意区间的概率
运用Excel计算偏斜分布任意区间的概率
来源: &&&&excel表格的基本操作教程
视频教程:
视频教程:
视频教程:
视频教程:
视频教程:
视频教程:
0 引言 高斯新分布[1]概率密度函数数学模型的建立概括了正态分布和偏斜分布。就是说随机变 量的频数分布在单峰的条件下存在对称与不对称的两种分布形态。由此引出期望差、左期望 差、右期望差的新概念。正态分布任意区间概率的计算方法及计算机的计算函数早以广泛应 用。而左右期望差在计算机应用的计算公式还是一个空白,在此条件下需要思考的是偏斜分 布任意区间概率的计算在计算机如何应用Excel 来实现的问题。
根据范剑青教授局部建模能降低统计误差[2]的新理念得出结论:随机变量的频数分布在 单峰的条件下,任意偏斜分布以期望值为界分为左右两部分都可分别看成是正态分布的一 半。由此就可以应用计算正态分布概率的方法来分别计算偏斜分布各不对称两边的概率。本 文根据具体的数据,首先应用常规的方法以期望值为线,分别计算偏斜分布左右两边任意区 间的概率,通过演算的过程和结果由此导入应用电子表格Excel[3]设计计算偏斜分布相同区 间概率的计算表。通过实例计算的过程介绍在Excel 中如何实现计算偏斜分布任意区间概率 的具体步骤和方法。计算过程表明:常规计算与Excel 计算,后者是一种简便快捷的方法。
更重要的是:本文通过统计实践在Excel 中计算偏斜分布任意区间概率的实例,为续后设计 期望差、左期望差、右期望差的计算函数软件提供理论依据。1 高斯新分布的定义和性质及参数的新概念 &自然界的事物基本上都很简单,所有的基础原理及主要问题都可以用数学方式表达, 这是应用数学家的一个信仰。&这句话出自应用数学大师林家翘的一次演讲。他归国八年以 来绝少面对媒体,但几乎每一次出现在镜头前他都会强调这一点──应用数学的意义在于揭 示自然界和社会实际问题的规律。[3]高斯新分布数学模型的提出正是建立了一个既能描述正 态分布又能描述偏斜分布的数学表达方式,应用它来揭示随机变量频数分布在不对称时的一 般规律问题。同时为计算偏斜分布任意区间的概率奠定理论基础。
高斯新分布(Gaussian new-distribution)的定义: 若-&<&<&,&- >0,&+ >0 为三个实数,则由下列密度函数: ( 2& &-) -1 exp[- 2 2 2 ( ) & & & x & ],x && f(x) = ( 2& &+ ) -1 exp[- 2 2 2 ( ) + & & x & ],x & & (1) 由以上密度函数确定的随机变量X 的分布称为高斯新分布。记为N(&,&-,&+)。
当&- = &+ 时呈正态分布; 当&- & &+ 时呈偏斜分布。
从以上高斯新分布的定义中明确了其概念的外延包括正态分布和偏斜分布两种形态。其 内涵&- = &+ 及&- & &+ 确定了数学表达式中所反映的高斯新分布的本质属性。
高斯新分布的性质: (1) 当&-=&+ 曲线f(x)关于直线x = & 对称,呈正态分布,有:&-=&+=& ,对应 的就有:& 2 & =& 2 + =&2 ; (2) 当&-&&+ 曲线f(x)关于直线x = & 不对称,呈偏斜分布,有:&-&&+&& ,对 应的就有:& 2 & && 2 + && 2 ; (3) 当x = & 时,f(&)=( 2& &-)-1 或f(&)=( 2& &+)-1是f(x)的最大值; (4) 在x = &- &-,x = &+ &+ 处曲线有拐点,当x&&&时,f(x)以x 轴为渐近线; (5) & 是描述&的集众位置,&-,&+ 分别是描述期望值左右两边离散程度的参数。
以上对高斯新分布密度函数f(x)性质的描述中,性质(1)以限制条件&-=&+ 确定描 述了正态分布。性质(2)以限制条件&- & &+ 确定描述了偏斜分布。性质(3)(4)(5) 则描述了正态分布和偏斜分布共同具有的性质。
高斯新分布性质(3)引出了对期望值的新定义。
期望值(expected value):随机变量的频数分布在单峰的条件下是分布曲线最大值点上 的取值。满足随机变量x =& 时, f (&) = ( 2& &-)-1或f (&) = ( 2& &+)-1为f (x)最大 值的条件。符号记为& 。
由于期望值两边不一定对称,所以期望值两边随机变量与期望值离散程度的变异指标就 不相等,期望差、左期望差、右期望差由此引出。
期望差(expected deviation):随机变量与期望值离差平方和的平均值的平方根。符号 记为:&。由于期望值两边不一定对称,就存在左期望差和右期望差。
左期望差(left-expected deviation):小于等于期望值的随机变量与期望值离差平方和的平均值的平方根。符号记为:&- 。
右期望差(right-expected deviation):大于等于期望值的随机变量与期望值离差平方和 的平均值的平方根。符号记为:&+ 。
从期望值的定义得出一个重要的结论:随机变量频数分布在单峰的条件下,随机变量不 一定围绕平均值波动,但一定是围绕期望值波动。这个结论为随后设计期望差、左期望差、 右期望差计算机函数软件提供了理论依据。
2 数据的收集及运用 Excel 进行整理与计算偏斜分布的参数 Excel 为收集到的原始统计资料进行频数分布的整理提供了方便。偏斜分布的不对称性 使左期望差不等于右期望差,在没有计算左期望差和右期望差的函数的条件下,需要应用 Excel 来进行统计计算。
以某磷矿企业某月的开采过程随机抽取的682 个样品的检测其品位的统计资料为例,运 用Excel 来实现整理频数分布及计算分布参数的统计过程,并将其具体步骤介绍如下: 步骤一:选定Excel 的一个工作表将682 个样品的检测数据运用Excel 编制变量数列, 绘制直方图[5]的方法求出分组的频数。(具体方法在Excel 的教科书都有介绍,本文不在赘 述。)本文的实例从实际出发确定组数为31,组距为1.0% 。
步骤二:根据组数,设计分布统计计算表,以便分别计算期望值左边与右边的频数、频 率(权数)、期望值、期望方差、期望差,以及分布的平均值。具体见表1。
步骤三:根据组距进行分组并计算组中值。将组距和组中值分别输入到表1 的第1 列和 第2 列中。
步骤三:确定每组的频数。选定频数最大一组的组中值为分布的期望值。将小于等于期 望值所在组的频数输入到表1 相应的第3 列中,即:期望值左边的频数。将大于等于期望值 所在组的频数输入到表1 相应的第7 列中,即:期望值右边的频数。。
步骤四:分别在表1 期望值左边第4 列和期望值右边第8 列对应的行计算组中值与期望 值之差。即:第4 列的计算结果是第2 列数据对应行数据与期望值的差;第8 列的计算结果 是第2 列数据对应行数据与期望值的差。
步骤五:分别在表1 期望值左边第5 列和期望值右边第9 列对应的行计算组中值与期望 值离差平方。即:第5 列的计算结果是第4 列数据对应行的平方;第9 列的计算结果是第8 列数据对应行的平方。
步骤六:分别在表1 期望值左边第6 列和期望值右边第10 列对应的行计算组中值与期 望值的加权离差平方。即:第6 列的计算结果是第3 列与第5 列数据对应行的乘积;第10 列的计算结果是第7 列与第9 列数据对应行的乘积。
步骤七:计算频数与加权离差平方的合计数。分别在表1 第3 列和第6 列的合计行计算 期望值左边的频数与期望值左边的加权离差平方和;分别在表1 第7 列和第10 列的合计行 计算期望值右边的频数与期望值右边的加权离差平方和。第3 列合计行期望值左边频数和的 计算方法是:小于期望值所在组中值对应频数之和加以等于期望值频数的二分之一。第7 列合计行期望值右边频数和的计算方法是:大于期望值所在组中值对应频数之和加以等于期 望值频数的二分之一。
步骤八:计算左期望方差、右期望方差。分别在表1 第6 列和第10 列的期望方差行计 算期望值左边的左期望方差与期望值右边的右期望方差。方法是:期望方差行对应第6 列的 单元格等于合计行第6 列单元格的数据加权离差平方和除以合计行第3 列单元格的数据期望合计行第10 列单元格的数据加权离差平方和除以合计行第7 列单元格的数据期望值右边频 数和,得到期望值右边的右期望方差。
步骤九:计算左期望差、右期望差。分别在表1 第6 列和第10 列的期望差行计算期望 值左边的左期望差与期望值右边的右期望差。方法是:期望差行对应第6 列的单元格等于期 望方差行第6 列单元格的数据左期望方差的平方根,得到期望值左边的左期望差。期望差行 对应第10 列的单元格等于期望方差行第10 列单元格的数据右期望方差的平方根,得到期望 值右边的右期望差。即:应用求平方根的计算函数&SQRT&在期望差行对应第6 列的单元格 输入&=SQRT(左期望方差所在的单元格或期望方差的具体数据)&点击Enter 后得到期望值 左边的左期望差。同理,在期望差行对应第10 列的单元格输入&=SQRT(右期望方差所在的 单元格或期望方差的具体数据)& 点击Enter 后得到期望值右边的右期望差。
步骤十:分别计算期望值左右两边的频率(权数)。分别在表1 第3 列和第7 列的频 率行计算期望值左边的左频率与期望值右边的右频率。方法是:频率行对应第3 列的单元 格等于期望值左边的左频数除以总频数。频率行对应第7 列的单元格等于期望值右边的右 频数除以总频数。
步骤十一:计算平均值。表1 第11 列各行对应的是第2 列组中值与第3 列频数相应行 的乘积,至期望值后是对应的是第2 列组中值与第7 列频数相应行的乘积。对应第11 列的 合计行的单元格是以上第11 列各行加权值之和。表1 第11 列是对应平均行等于上一合计 行除以总频数,得到分布的平均值。
以上表1 的十一个步骤(步骤一没有在表1 中列出,其具体的方法在Excel 的教科书都 有详细介绍)在Excel 实现数据的整理和频数分布及分布参数期望值、左期望方差、右期望 方差、左期望差、右期望差,以及左频率、右频率、平均值的计算方法。
根据表1 的计算,得到如下数据(以下数据除频数、频率和求出的概率值外,其它数据 单位均为%): 期望值左边的频数为:n& =260 , 期望值右边的频数为:n+=422 , 频数合计为:n = n& +n+ =682 , 分布的期望值(众数)为:&= 20.50 , 期望值左边的频率(权数)为:0.3812 , 期望值右边的频率(权数)为:0.6188 , 平均值: x = 1/n &S = n i 1 xi fi =22.86 , 左期望方差:& 2 & = &S & = n i 1 (xi-&)2/n-= 20.25 , 右期望方差:& 2 + =&S = &+ n i n 1(xi-&)2/n+= 57.55 , 左期望差:&-=[ &S & = n i 1 (xi-&)2/n-]1/2= 4.50 , 右期望差:&+=[&S = &+ n i n 1(xi-&)2/n+]1/2= 7.59 。
通过表1 数据计算统计得出,平均值x 不等于期望值&。呈现偏斜分布,从而使左期望 差&-与右期望差&+ 也不相等。根据高斯新分布的性质(2),当&-&&+ 曲线f(x)关于直 线x = & 不对称,呈偏斜分布。P{0&&&100}=P-{0&&&&}+P+{&&&&100} = &20.5 0 f-(t)dt+ &+& 20.5 f+(t)dt = n-&n + n+&n = 1 (注:矿石的品位数据区间只在0~1,即:0%~100%之间取值。) (2)式精确地描述了图1 的分布曲线。根据的是范剑青教授局部描述能降低统计误差 的理念。即:将图1 分布曲线小于期望值&=20.5 左边看成是正态分布的一半,称为左正态 f-(x)。图1 分布曲线大于期望值&=20.5 右边看成是正态分布的另一半,称为右正态f+(x)。
高斯新分布的原理在(1)和(2)式得到充分的体现。由此可以得到图1 分布曲线两拐点间 的概率,计算如下: 分布曲线左边的拐点 = 期望值-左期望差 = 20.50-4.50 = 16.00 ; 分布曲线右边的拐点 = 期望值+右期望差 = 20.50+7.59 = 28.09 。
容易得到某磷矿企业某月的开采磷矿主品位质量指标在P{16.00&&&28.09}区间的概 率为0.6826。
4 偏斜分布任意区间概率的常规演算 根据以上公式及以上计算出参数的已知结果,偏斜分布任意区间的概率按常规的计算过 程如下: 通过表1 计算结果,已知: 期望值:&= 20.50 偏斜分布左函数的频数:n-= 260 偏斜分布右函数的频数:n+ = 422 左期望差:&-= 4.50 右期望差:&+ = 7.59 分部左函数频数的比率(权数):f1 = n- & n = 260 & 682 = 0.3812 分部右函数频数的比率(权数):f2 = n+ & n = 422 & 682 = 0.6188 实例中磷矿主品位的检测数据服从参数为&= 20.50,&- = 4.50,&+ = 7.59 的偏斜分 布。设&~N(&,&-,&+ )即,服从&~N(20.5,4.50,7.59 )。试求磷矿主品位数在区 间[15,30]的概率。已知&=20.50,由于不对称,所以需要将分布以期望值为中线把所求概 率的区间[15.00,30.00]分为 [15.00,20.50],[20.50,30] 两个区间来分别计算。
所求区间分左右两部分的概率可表示如下: P-{15.00&&&20.50}=F(20.50)-F(15) P+{20.50&&&30.00}=F(30.00)- F(20.50) 设所求区间各点值分别为:&1=15.00,&2=20.50,&3=30.00 分布左函数,设&~N(&,& 2 & ),则&~N(20.5,4.52 ) 所求概率P-{15.00&&&20.50}。
取变换&= & & & & & ,使其标准化。
设:P 正- 为按正态分布计算分布左函数的概率,以上计算偏斜分布各自左右两部分的概率,仅仅占各自部分的一半,还需各自乘以2。
以下给出理由: 前面已经提出,在偏斜分的条件下,期望值减左期望差,期望值加右期望差,是此分布 曲线的拐点。以期望为中线左曲线的拐点至期望值区间的概率为0.3413,由于把左函数看作 是正态分布的一半,所以左曲线拐点至期望值区间的概率为等于0..6826,它是 占左边整个区间的概率。同理,右也一样。
令:左边函数概率为1。
设:P-为偏斜分布左函数概率。
则:P-{15.00&&&20.50} = P 正-{15.00&&&20.5}&2 = 0.3892&2 = 0.7784 即:0.7784 是P-{15.00&&&20.50}占左函数区间的概率。
令:右边函数概率为1。
设:P+为偏斜分布右函数概率。
则:P+{ 20.50&&&30.00}=P 正+{ 20.50&&&30.00}&2=0..7984即:0.7894 是P+{ 00.50&&&30.00}占右函数区间的概率。
根据已知偏斜分布左右函数频数的比率(权数): 分部左函数频数的比率(权数):f1 = 0.3812 分部右函数频数的比率(权数):f2 =0.6188 按比率调整计算偏斜分布的左右函数的实际概率,方法及计算过程如下: 设:P 偏-为按比率调整计算偏斜分布左函数的实际概率, P 偏-{15.00&&&20.50} = P -{15.00&&&20.50}&f1 = 0.2 = 0.2967 设:P 偏+为按比率调整计算偏斜分布右函数的实际概率, P 偏+{20.50&&&30.00} = P+{20.50&&&30.00}&f2 = 0.8 = 0.4885 设:P 偏为按比率调整计算偏斜分布整体函数的实际概率, P 偏{15.00&&&30.00} = P 偏-{15.00&&&20.50} + P 偏+{20.50&&&30.00} =0.2967 + 0.4885 =0.7852 求得磷矿主品位数在区间[15.00,30.00]的概率为0.7852。
通过以上实例的常规计算可知,计算过程是相当繁琐,选定计算区间进行标准化后需要 应用查正态概率表来计算。况且表1 已运用Excel 将偏斜分布的参数计算得出,否则的话用 常规的方法计算左右期望差更是件繁琐的事。所以有必要应用电子表格Excel 来计算偏斜分 布任意区间的概率,以得到一种更便捷的计算方法。
5 偏斜分布任意区间概率计算在 Excel 的实现方法 将收集到的原始数据在 Excel 进行了初步的输入,通过排序整理分组得到每组的频数, 设计出统计计算表1。通过表1 计算出求概率的全部基本参数。
已知: 期望值:&=20.50 左期望差:&- =4.50 右期望差:&+ =7.59 应用计算正态分布概率的计算函数NORMDIST 计算: P 正-{15.00&&&20.50} =NORMDIST(20.5,20.5,4.5,TRUE) -NORMDIST(15,20.5,4.5,TRUE) =0.8 =0.3892 P 正+{ 20.50&&&30.00} =NORMDIST(30,20.5,7.59,TRUE)-NORMDIST(20.5,20.5,7.59,TRUE) =0.0 =0.3947 根据以上计算结果作调整得: P-{15.00&&&20.50} = P 正-{15.00&&&20.5}&2= 0.3892&2 = 0.7784 P+{ 20.50&&&30.00}= P 正+{ 20.50&&&30.00}&2 =0.3947&2 =0.7984 根据偏斜分布左右频数的权数计算偏斜分布左右的概率: P 偏-{15.00&&&20.50} = P -{15.00&&&20.50}&f1 = 0.2 = 0.2967 P 偏+{20.50&&&30.00} = P+{20.50&&&30.00}&f2 = 0.8 = 0.4885 根据以上计算偏斜分布左右的概率计算所求区间的概率: P 偏{15.00&&&30.00} = P 偏-{15.00&&&20.50} +P 偏+{20.50&&&30.00} = 0.2967 + 0.4885 = 0.7852 通过以上计算过程,以下介绍在Excel 实现的方法: 根据表1 数据,求偏斜分布任意区间概率所需要的参数在Excel 下设计统计计算表2 如 下: 表2 Excel 偏斜分布区间概率计算模式 Tab. 2 Excel Skewed distribution of interval probability model(注:表2 颜色行为Excel 电子表的英文列符,颜色列为Excel 电子表的行序。常规的 计算与Excel 电子表格计算结果期望值左边的概率相差0.0001。其原因是两种计算方法小数 点取舍不一致所造成,不影响其应用。) 以上表2 的数据从单元格A5:F29 可以从表1 自动获取(具体的方法略)。以下介绍 A31 至F35 各单元格数据来源的具体操作方法。
定义区间数据的单元格保留两位小数,定义概率数据的单元格保留四位小数。
A31&=A15&,D32&=D5&回车分别都得分布期望值:20.50 。
A32 和D31 分别直接输入起止区间的具体数据(表2 的红色数据)。
B31&=NORMDIST(A31,A31,C28,TRUE)&回车,得:0.5000。
B32&=NORMDIST(A32,A31,C28,TRUE)& 回车,得:0.1108。
B33&=B31-B32& 回车,得:0.3892。
C31&=B31*2&,C32&=B32*2&,C33&=B33*2&。
C34&=C33*B29&回车,得:0.2968。
E31&=NORMDIST(D31,D32,F28,TRUE)& 回车,得:0.8948。
E32&=NORMDIST(D32,D32,F28,TRUE)& 回车,得:0.5000。
E33&=E31-E32& 回车,得:0.3948。
F31&=E31*2&,F32&=E32*2&,F33&=E33*2&。
F34&=F33*E29&回车,得:0.4825。
B35&=A32&,C35&=D31&,F35&=C34+F34&。
表2 中单元格F35 所得出的数据就是所求偏斜分布选定区间的概率。通过表2 可以求本 例任意区间的概率,只须在A32 输入区间的起始数据,在D31 输入区间的终止数据即可得 到F35 对应需要得到的概率。
运用Excel ,通过表1 统计计算表,计算出求偏斜分布任意区间概率所需要的参数,以 此为基础生成表2 的单元格A5 至F29 的数据。在A31 至F35 设计出求偏斜分布任意区间 的概率,通过实例计算过程说明偏斜分布任意区间的概率计算问题可以在Excel 中实现。6 结论 在计算机还没有直接计算左期望差和右期望差的条件下,本文以某磷矿随机检验抽取的 样品所检测的品位资料为例,运用Excel 编制变量数列,绘制直方图的方法求出分组的频数。
在Excel 编制计算期望值与左期望差和右期望差的参数,判定得出服从偏斜分布的结论。依 据高斯新分布概率密度函数的数学模型,通过实例以常规的演算方法和运用Excel 演算的方 法分别对偏斜分布任意区间的概率进行演算。结果表明运用Excel 方法来计算偏斜分布任意 区间的概率虽然是一种可行的便捷新方法。重要的是通过本文的实例演算为续后设计期望 差、左期望差、右期望差的计算函数软件提供理论依据。&
相关推荐:
·Excel技巧:
·Excel技巧:
·Excel技巧:
·Excel技巧:
·Excel技巧:
·Excel技巧:
·Excel技巧:
·Excel技巧:
运用Excel计算偏斜分布任意区间的概率如何用wps表格函数计算各地区在某重量区间的快
问题描述:如何用wps表格函数计算各地区在某重量区间的快递费用?我不懂函数,希望有爱心人士提供一个公式,谢谢!
推荐回答:假设资料表的名称为sheet2 在费用下面就是K4输入公式下拉=IFERROR(VLOOKUP(LOOKUP(J4,{0,0.6,1.1,2.1,3.1,4.1,5.1},{&0-0.5&,&0.6-1&,&1.1-2&,&2.1-3&,&3.1-4&,&4.1-5&,&5.1-6&}),Sheet2!A:AF,MATCH(F4,Sheet2!$A$2:$AF$2,0),0)*I4,&未建项&)例图,因数据太多,只做几个关键数据看一下就可位置与你的数据位置一样
相关知识:
为您推荐:
求给一份EXCEL版本的门市现金日记账、库...
不好意思啊,我太笨了,我没做出来,...
如何在EXCEL格子中查找东西时让查找的框...
为什么我的Excel表格中排序扩展排序后对...怎么用excel求方差,置信区间_百度知道
怎么用excel求方差,置信区间
本人毕业论文要数据处理,可是不知道运用excel,求助一下
用excel求方差:插入---函数---统计-----VAR或VARP VAR分母N减了1,估算样本方差。 VARP分母N,计算样本总体的方差 由于样本受到限制,一般n不大,一般用估算样本方差。 当大面积的如学生成绩统计,上千万,VAR、VARP都可以,只有数学意义上的区别! 统计的精意就在于用部分推测总体!现实世界的“总体方差”往往是无法知道的,实际中用的“估算样本方差” ( 当然我们可以求“标准差”---再平方 ----同样有函数公式的) 有关函授的参考: VAR(number1,number2,...) Number1,number2,... 为对应于与总体样本的 1 到 30 个参数。 说明 函数 VAR 假设其参数是样本总体中的样本。如果数据为样本总体,则应使用函数 VARP 来计算方差。 省略逻辑值(TRUE 或 FALSE)和文本。如果逻辑值和文本值不能省略,请使用 VARA 工作表函数。 VARP 参阅 计算样本总体的方差。 语法 VARP(number1,number2,...) Number1,number2,... 为对应于样本总体的 1 到 30 个参数。 省略逻辑值(TRUE 和 FALSE)和文本。如果不能省略逻辑值和文本,请使用 VARPA 工作表函数。 说明 函数 VARP 假设其参数为样本总体。如果数据只是代表样本总体里的部分样本,请使用函数 VAR 计算方差。 其余看帮助!
其他类似问题
置信区间的相关知识
您可能关注的推广
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁excel求置信区间 excel 置信区间 excel算置信区间 置信区间怎么求 求置信区间 exc..
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
用Excel求置信区间
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口

我要回帖

更多关于 用excel求方差 的文章

 

随机推荐