绝对平均差 方差 平均绝对百分误差方差 的...

什么是均方差?怎么计算?
什么是均方差?怎么计算?
09-01-26 & 发布
什么是方差样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;样本方差的算术平方根叫做样本标准差。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。 数学上一般用E{[X-E(X)]^2}来度量随机变量X与其均值E(X)的偏离程度,称为X的方差。 定义 设X是一个随机变量,若E{[X-E(X)]^2}存在,则称E{[X-E(X)]^2}为X的方差,记为D(X)或DX。即D(X)=E{[X-E(X)]^2},而σ(X)=D(X)^0.5(与X有相同的量纲)称为标准差或均方差。 由方差的定义可以得到以下常用计算公式: D(X)=E(X^2)-[E(X)]^2 方差的几个重要性质(设一下各个方差均存在)。 (1)设C是常数,则D(C)=0。 (2)设X是随机变量,C是常数,则有D(CX)=C^2D(X)。 (3)设X,Y是两个相互独立的随机变量,则D(X+Y)=D(X)+D(Y)。 (4)D(X)=0的充分必要条件是X以概率为1取常数值C,即P{X=C}=1,其中E(X)=C。
请登录后再发表评论!
对统计误差的几点认识  众所周知,统计数据的准确性是统计工作的生命,提高统计数据质量是统计工作的重中之重。然而,对如何评价统计数据质量的统计误差指标,却是统计部门和统计工作者秘而不宣或者忌讳的问题,甚至在《统计学原理》中都很少讨论,广大群众对此颇有微词,笔者认为有必要进行探讨并澄清一些事实。 一、            统计误差的分类
  顾名思义,误差是指一个量的观测值或计算值与其真值之差;统计误差,即反映某客观现象的一个量在测量、计算或观察过程中由于某些错误或通常由于某些不可控制的因素的影响而造成的变化偏离标准值或规定值的数量。那么统计误差有哪几种呢?
  1.按产生统计误差的性质来分有:空间误差、时间误差、方法误差和人为误差四种。
  空间误差是指统计调查范围所产生的误差,包括重漏统计调查单位,跨区域统计等;
  时间误差是指统计调查对象因时期或时点界定不准确所产生的误差。如企业核算时间不能满足统计部门的报表制度要求而估报所产生的误差;延长或缩短时期所产生的误差;时期错位产生的误差等。
  方法误差是因使用特定的统计调查方法所产生的误差。如抽样调查中的代表性误差(抽样平均误差),它是指采用抽样调查方法中的随机样本(非全面单位)来推算总体所产生的误差的平均值,不是绝对的统计误差。对代表性误差可以根据组织方法和抽取本的容量,一般可以计算其平均误差,而且通过扩大样本量或优化调查的组织方法来缩小。又如统计部门因人力、物力和财力等资源不足,致使报送渠道不畅通,统计调查不到位,推算方法不科学、不规范所产生的误差。
  人为误差是指在统计设计、调查、整理汇总和推算等过程中因人为过错产生的误差。人为误差是统计误差中产生因素最多的一类,它又分为度量性误差、知识性误差、态度性误差和干扰性误差。度量性误差是指统计指标因计量或者从生产量到价值量换算所产生的误差;知识性误差是指统计人员因统计知识不够,对统计指标的涵义不理解或错误理解所产生的误差;态度性误差是指统计人员因对统计工作不负责而随意填报统计数据而产生的误差,包括乱报、漏填或不按规定的计量单位填报等;干扰性误差是指统计对象或统计部门受某种利益驱动而虚报、漏报或者捏造统计数据所形成的误差。 2.统计误差按工作环节来分有:源头误差、中间环节误差和最终误差三种。源头误差是指起报单位或申报者所产生的误差;中间环节误差是指统计调查数据在逐级上报过程中所产生的误差,包括加工整理、汇总和推算等环节;最终误差是指下级各基层数据汇总数或规范的方法得到的推算数与最终使用数之间的差异值。按工作环节划分的统计误差类别是相对的,中间环节误差在不同的场合有可能是源头误差,也可能是最终误差。源头误差在有些场合也叫调查误差,或叫登记误差。
  二、对统计误差的几点认识
  1.宏观统计的误差是客观存在的,不以人们意志为转移的,统计部门的任务就是尽可能缩小统计误差。如计量误差,比方人的高度都有早晚不一致的现象存在,不同调查单位因量器质量不同、标准不同也必定产生误差。再如空间性误差,在实际统计过程由于社会经济现象的复杂性无法涵盖所有的调查单位所产生的误差。又举个最通俗的例子,菜贩买入100斤菜零售最后加总后可能是98斤,也可能不断往菜上泼水买出102斤,这就充分说明统计误差的客观存在性。
  2.当前中国统计基础薄弱,统计数据质量不可高估,有些统计指标的误差还相当大。统计部门不要“黄婆买瓜,自买自夸”了,一定要有忧患意识。我记得一位香港统计专家曾指出:“中国统计好比建在沙漠的房子”,言外之意就是基础不牢。如GDP核算,全国数据与各省汇总数据有不少的差距,由地市汇总的数据与省一级的差距也很大,据说有些省差异率高达30%,如果以“各对50大板”计,其误差率也达到15%。又如1998年全国GDP的增长率为7.8%,而全国只有个别省低于7.8%,各省加权的平均增长速度近10%,全年新增GDP数值全国与各省的差异率高达25%以上。
  3.计划和各类政绩考核对统计数据干扰不可低估。如果有兴趣的话,你可以统计一下各地GDP增幅比计划高或者持平的比率,可能是相当高的,这并不是说明计划部门的计划多么精确合理,而是说明统计数据确实受到干扰,当然干扰数据不一定是各级领导,而是统计部门或者方法不规范所致。再比如我市某乡镇若干年上造和下造的水稻播种面积一致,而且与考核指标有惊人的相似。又如有些乡镇不再需要村文书报数据,而是给乡镇反馈数据。
  4.统计工作不是生长在“真空”中,统计数据也受到党风、社会风气、法律氛围和各种秩序的影响,因此统计部门无法完全控制统计误差。如统计源头数据或者原始凭证是财务核算或业务核算的数据,在这个环节出现误差,光靠统计部门是远远不够的。 5.统计误差与投入的人力、财力密切相关。现在上级统计部门动不动增加统计调查任务,根本不考虑基层的承受能力,导致数据质量严重下滑,统计职业道德有“沦丧”的危险,所谓“车到山前必有路”、“越难统计越好做”都说明了这些。 6.在统计工作中应有估计的合法地位。我们在推行抽样调查过程中,一般都采用点估计,实际是利用样本均值来推算,这本身就有代表性误差,应该在误差控制范围允许做适当的调整,以保证历史数据的平滑。在统计守法方面,往往政府统计部门及其统计人员可能是最大的违法者,在日常统计工作中有大量的估计成份,如基层报不齐需要估报,基层数据不符合逻辑需要调整等,这些都得不到统计法律、法规的保障,还好统计部门在守法和执法既是运动员又是裁判员。因此,统计工作中应在科学、规范的基础上允许进行必要的估计,并在《统计法》上明确给予综合统计部门这一权利。 7.统计部门要有科学的态度,不能做数字游戏,不要亵渎《统计法》赋予的“权威”。一是对每一项工作不能敷衍了事,要有求真务实的精神和精品意识,当前普查工作过多过滥的嫌疑,数据质量也不高,基层政府财政苦不堪言,而普查数据对当地经济建设或者决策的作用却不大;二是不能在人力、财力和物力不许可的情况下,不能层层布置落实新统计项目,如乡镇一级计算国内生产总值;三是要善用抽样调查,有些地方为考核乡镇政绩,每一个乡镇整群抽取10户农户登记(不超过总体1%)计算农民纯收入,显然代表性误差非常大,人为作假更为方便;四是基层政府统计部门的人员配置只能应付数据采集、处理任务,对社会经济运行的分析研究不是统计部门的优势,要扬长避短,不要顾此失彼,如果没有准确的统计数据,就不可能有高质量的统计分析,若只是数据文字化则本身就是徒劳。 8.要关注“富瞒穷虚”的统计现象。不少富裕地区没有完善全面反映社会经济的发展情况,反映总量指标时瞒的成分非常大,美言“留有余地”,而且在反映增长速度时大搞“橡皮筋”游戏,有很好的伸缩力,想缓速度少报几个单位,想加快速度多挖潜几个单位;而穷的、经济基础比较薄弱的地区,有强烈的“赶超”意识,千方百计地利用统计上的“盲点”,提高经济总量及其发展速度。如无法详尽搜集到统计资料的限额以下工业总产值、农业总产值等大做文章,来料加工产品按全值计算等。 三.统计部门在缩小统计误差中的应有作为
  1.统计设计中必须对登记误差有要补救措施,建立所谓“测谎”系统。源头数据质量问题统计部门往往把责任推给受调查者,有无能为力之感。如农业普查采取逐户登记的办法进行,农户往不往不能或不敢如实申报,多数应该是少报,而我们在实际普查过程中,事后质量抽查实质是为了“测谎”,可惜很多普查机构对这一环节重视不够,面上调查完成后有大功告成的感觉,对这一阶段工作敷衍了事,不敢揭露问题,不深入开展工作,往往得到的误差几乎为零,使这一环节气扎扎实实走过场,得到结果可想而知,如农普的畜牧生产情况数据与原来的统计数据甚远,究竟哪个为准都没有说服力。在抽样调查方案设计中,也应建立“测谎”系统,否则调查误差始终是统计数据质量的“瓶颈”。 “ 测谎”系统要建立必要指标体系和评价方法,要广泛使用数理统计中的假设检验方法。
  2.必须有完善的指标体系及其计算方法。目前在总结国民经济核算体系中就速度问题的计算方法重视不够,五花八门,无所适从。而且到目前为止是继续采用过去一起沿用的不变价方法,还采用价格指数剔除法都不很明确,甚至专业统计和综合平衡统计计算方法截然不同,甚至省和市一级的计算方法也不同,公布的速度也不一样,造成不良的社会影响。
  3.在抽样调查工作中,上下应该采取不同的样本,对总体单位较少的总体不宜采用抽样调查。上下采用同一样本最容易受到人为的干扰,特别是统计部门为了保持数据的延续性所作各种“技术性”调整。抽样调查在国家一级和省一级大面积推广积极作用不容质疑,但在地市一级、县级进行就不是“一抽就灵”, 如某县在商饮抽样调查中,抽3-5单位推算全县的饮食业零售额,其误差和人为因素就可想而知。因此,统计部门要在对总体分析的基础分析再选择调查方法。 4.在统计体制上必须进行彻底的变革。国家、省一级的正常统计任务今后应以三支调查作为其调查骨干,不应再采取逐级上报的方式。市、县及以上统计机构的统计任务以为当地党政领导决策服务为主,统计基本内容可统一,但要赋予更大的主动权。 5.加大统计执法力度,保证源头数据的准确性。基层统计部门今后应在加强统计信息工程建设的基础上从数据采集的圈圈中跳出来,重点加大统计执法检查,对弄虚作假的单位要坚决严肃查处,在立法上罚款数额应该大幅增加,以威慑统计违法者,逐步建立全社会的统计诚信体系。 本文是作者对统计误差的肤浅认识,旨在唤起统计部门更重视统计数据质量,提高统计服务水平,抵制统计上弄虚作假的行为,同时希望得到领导和社会各界对统计工作的理解和支持。
请登录后再发表评论!平均差和均方差的区别_百度作业帮
平均差和均方差的区别
平均差是表示各个变量值之间差异程度的数值之一.指各个变量值同平均数的的离差绝对值的算术平均数.计算公式为:平均差 = (∑|x-x'|)÷n ,其中∑为总计的符号,x为变量,x'为算术平均数,n为变量值的个数.
您可能关注的推广回答者:汇聚1000万达人的兴趣社区下载即送20张免费照片冲印
扫码下载App
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!&&|&&
LOFTER精选
网易考拉推荐
阅读(7920)|
用微信&&“扫一扫”
将文章分享到朋友圈。
用易信&&“扫一扫”
将文章分享到朋友圈。
历史上的今天
loftPermalink:'',
id:'fks_084066',
blogTitle:'均方根误差与标准差、均方差、标准偏差',
blogAbstract:'
有人经常混用均方根误差(RMSE)与标准差(Standard Deviation),实际上二者并不是一回事。
1.& 均方根误差
均方根误差为了说明样本的离散程度。
均方根误差(root-mean-square error )亦称标准误差,其定义为 ,i=1,2,3,…n。在有限测量次数中,均方根误差常用下式表示:',
blogTag:'',
blogUrl:'blog/static/',
isPublished:1,
istop:false,
modifyTime:7,
publishTime:7,
permalink:'blog/static/',
commentCount:2,
mainCommentCount:2,
recommendCount:0,
bsrk:-100,
publisherId:0,
recomBlogHome:false,
currentRecomBlog:false,
attachmentsFileIds:[],
groupInfo:{},
friendstatus:'none',
followstatus:'unFollow',
pubSucc:'',
visitorProvince:'',
visitorCity:'',
visitorNewUser:false,
postAddInfo:{},
mset:'000',
remindgoodnightblog:false,
isBlackVisitor:false,
isShowYodaoAd:false,
hostIntro:'',
hmcon:'1',
selfRecomBlogCount:'0',
lofter_single:''
{list a as x}
{if x.moveFrom=='wap'}
{elseif x.moveFrom=='iphone'}
{elseif x.moveFrom=='android'}
{elseif x.moveFrom=='mobile'}
${a.selfIntro|escape}{if great260}${suplement}{/if}
{list a as x}
推荐过这篇日志的人:
{list a as x}
{if !!b&&b.length>0}
他们还推荐了:
{list b as y}
转载记录:
{list d as x}
{list a as x}
{list a as x}
{list a as x}
{list a as x}
{if x_index>4}{break}{/if}
${fn2(x.publishTime,'yyyy-MM-dd HH:mm:ss')}
{list a as x}
{if !!(blogDetail.preBlogPermalink)}
{if !!(blogDetail.nextBlogPermalink)}
{list a as x}
{if defined('newslist')&&newslist.length>0}
{list newslist as x}
{if x_index>7}{break}{/if}
{list a as x}
{var first_option =}
{list x.voteDetailList as voteToOption}
{if voteToOption==1}
{if first_option==false},{/if}&&“${b[voteToOption_index]}”&&
{if (x.role!="-1") },“我是${c[x.role]}”&&{/if}
&&&&&&&&${fn1(x.voteTime)}
{if x.userName==''}{/if}
网易公司版权所有&&
{list x.l as y}
{if defined('wl')}
{list wl as x}{/list}方差_百度百科
关闭特色百科用户权威合作手机百科
收藏 查看&方差[fāng chà]
方差是各个数据分别与其平均数之差的平方的和的,用字母D表示。在概率论和数理统计中,方差(Variance)用来度量和其(即)之间的偏离程度。在许多实际问题中,研究随机变量和均值之间的偏离程度有着重要意义。外文名variance类&&&&别数学
如下面的例子:
已知某的真实长度为a,现用甲、乙两台仪器各测量10次,将测量结果X用上的点表示如图:
甲仪器测量结果:
乙仪器测量结果:全是a
两台仪器的测量结果的均值都是 a 。但是用上述结果评价一下两台仪器的优劣,很明显,我们会认为乙仪器的性能更好,因为乙仪器的测量结果集中在均值附近。
由此可见,研究随机变量与其均值的偏离程度是十分必要的。那么,用怎样的量去度量这个偏离程度呢?容易看到E[|X-E[X]|]能度量随机变量与其均值E(X)的偏离程度。但由于上式带有,运算不方便,通常用量E[(X-E[X])2] 这一数字特征就是方差。
一般用下面公式进行计算:
D(X)=E(X2)-[E(X)]2
方差不只是为了取正值,它有很直接的意义,源自。以典型的随机散步为例:醉汉每步的长度为Xi,以(xi, yi)表示,有xi2 + yi2= Xi2。走了N步时距离起始点的路程为X, 则 X2 = ∑ (xi2+ yi2) = ∑ Xi2,这正是方差。若每步的距离相等,都是单位距离,则方差 X2 = ∑ Xi2 = N 。方差方差是实际值与之差的平均值,而是方差算术。[1] 在实际计算中,我们用以下公式计算方差。
方差是各个数据与之差的平方的和的平均数,即 ,其中,x表示的平均数,n表示样本的数量,xi表示个体,而s^2就表示方差。
而当用 作为样本X的方差的估计时,发现其数学期望并不是X的方差,而是X方差的倍, 的数学期望才是X的方差,用它作为X的方差的估计具有“”,所以我们总是用 来估计X的方差,并且把它叫做“”。
方差,通俗点讲,就是和偏离的程度!用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差。记作S2。 在相同的情况下,方差越大,说明数据的波动越大,越不稳定。
公式可以进一步推到为:其中x为这组数据中的数据,n为大于0的整数。设X是一个,若E{[X-E(X)]2}存在,则称E{[X-E(X)]2}为X的方差,记为D(X),Var(X)或DX。
即D(X)=E{[X-E(X)]2}称为方差,而σ(X)=D(X)0.5(与X有相同的)称为标准差(或)。即用来衡量一组数据的离散程度的。
方差刻画了随机变量的取值对于其数学期望的。(标准差、方差越大,离散程度越大。否则,反之)
若X的取值比较集中,则方差D(X)较小,
若X的取值比较分散,则方差D(X)较大。
因此,D(X)是刻画X取值分散程度的一个量,它是衡量取值分散程度的一个尺度。当数据分布比较分散(即数据在平均数附近波动较大)时,各个数据与平均数的差的平方和较大,方差就较大;当数据分布比较集中时,各个数据与平均数的差的平方和较小。因此方差越大,数据的波动越大;方差越小,数据的波动就越小。[2]由知,方差是随机变量 X 的
g(X)=[X-E(X)]2 pi
数学期望。即:
由方差的定义可以得到以下常用计算公式:
D(X)=∑xi2pi-E(x)2
D(X)=∑(xi2pi+E(X)2pi-2xipiE(X))
=∑xi2pi+∑E(X)2pi-2E(X)∑xipi
=∑xi2pi+E(X)2-2E(X)2
=∑xi2pi-E(x)2
方差其实就是标准差的平方。周期方差曲线(1)设c是,则D(c)=0。
(2)设X是随机变量,c是常数,则有D(cX)=c2D(X)。
(3)设 X 与 Y 是两个随机变量,则
D(X+Y)= D(X)+D(Y)+2Cov(X,Y)
D(X -Y)= D(X)+D(Y)-2Cov(X,Y)
特别的,当X,Y是两个不相关的随机变量则
D(X+Y)=D(X)+D(Y),D(X-Y)=D(X)+D(Y),
此性质可以推广到有限多个两两不相关的随机变量之和的情况。
(4)D(X)=0的是X以为1取常数值c,即X=c,a.s.其中E(X)=c。
(5)D(aX+bY)=a2DX+b2DY+2abCov(X,Y)。半方差图期望和方差求解公式
随机变量X。
X服从(0-1)分布,则E(X)=p D(X)=p(1-p)
X服从,即X~ π(λ),则 E(X)= λ,D(X)= λ
X服从,即X~U(a,b),则 ,
X服从,即X~e(λ), E(X)= 1/λ,D(X)= 1/λ2
X服从,即X~B(n,p),则E(x)=np, D(X)=np(1-p)
X 服从,即X~N(μ,σ2), 则E(x)=μ, D(X)=σ2
X 服从,即X~N(0,1), 则E(x)=0, D(X)=1
随机变量求方差的通用公式,即D(X)=E(X2)-[E(X)]2样本中各数据与的差的平方和的平均数叫做样本方差;样本方差的叫做样本。n-1样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。
方差和标准差。方差和标准差是测算离散趋势最重要、最常用的。方差是各变量值与其平方的平均数,它是测算的最重要的方法。标准差为方差的算术平方根,用S?表示。方差相应的计算公式为
标准差与方差不同的是,标准差和变量的计算单位相同,比方差清楚,因此很多时候我们分析的时候更多的使用的是标准差。(甘肃省,2002年)某校初三年级甲、乙两班举行电脑汉字输入速度比赛,两个班参加比赛的学生每分钟输入汉字的个数,经统计和计算后结果如下表所示:
班级参加人数平均字数方差甲
有一位同学根据上表得出如下结论:
①甲、乙两班学生的平均水平相同
②乙班优秀的人数比甲班优秀的人数多(每分钟输入汉字达150个以上为优秀)
③甲班学生比赛成绩的波动比乙班学生比赛成绩的波动大。上述结论正确的是________(填序号)。
解:填①、②、③,
解:甲乙的平均数相同,所以①甲、乙两班学生的平均水平相同.根据中位数可知乙的中位数大,所以②乙班优秀的人数比甲班优秀的人数多。第三题,根据方差数据可知,方差越大波动越大,反之越小,所以甲班学生比赛成绩的波动比乙班学生比赛成绩的波动大。
故填:①②③.
点评:本题考查统计知识中的中位数、平均数和方差的意义。要知道平均数和中位数反映的是数据的,方差反映的是离散程度。
极差不能用作比较,单位不同 ; 方差能用作比较, 因为都是个比率。
新手上路我有疑问投诉建议参考资料 查看平均绝对误差怎么求,绝对值怎么求,标准差和均方差呢_百度知道
平均绝对误差怎么求,绝对值怎么求,标准差和均方差呢
我有更好的答案
按默认排序
所以有限次测量结果的算术平均值是最接近实际值的。 均方差又称均方根误差。如果误差统计分布是正态分布,这时的误差称平均误差;(n-1)]=Re。例如 -2的绝对值是 |2| 。(N次测量的误差相加后除以N) 绝对误差指测量值与实际值(或标准值)之差的绝对值。其定义为 ,指上面 土3σ 的边界的绝对值。 绝对值指将一个数值平方后在开方的结果。仪表有个最大允许误差,均方根误差常用下式表示,式中。实际上就是去掉正负号。在有限测量次数中。表示时在两边加上 |
,…n:√[∑di*2&#47。它可作为衡量测量精度的一种数值指标,i=1,2,3在测量中将被测的真实值定义为无穷次测量中偶然误差的算术平均值:n为测量次数;di为一组测量值与平均值的偏差,那么随机误差落在土σ以内的概率为68%。 标准差指上面 土σ 的边界的绝对值
其他类似问题
均方差的相关知识
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁

我要回帖

更多关于 误差方差 的文章

 

随机推荐