中位数与各求一组数据的中位数距离最长

关注今日:1 | 主题:181176
微信扫一扫
扫一扫,下载丁香园 App
即送15丁当
【求助】统计图:中位数(四分位间距)怎么画统计图
页码直达:
这个帖子发布于2年零302天前,其中的信息可能已发生改变或有所发展。
各位战友:
毕业在即,写论文遇到很多问题。
我的是病例对照研究,两组比较,数据均为连续变量非正态分布,所以选择
中位数(四分位间距)的表示方式,如234(120-356),但是不晓得这类数据画图的时候选择何种统计图,我看很多文章画的柱状图带误差线很漂亮(见下图1),但是好像这种图只适用于均数 标准差,是否适用于中位数,如果可用于中位数,那误差线的数据来源是什么?别人的误差线好像是标准差,困惑啊。
还有就是看书,很多都提示中位数(四分位间距)要用箱图表示(见下图2),但是,我的箱图做出来很多异常点啊,一点也不好看,如果必须要做箱图,如何去掉异常点。
谁有关于统计图方面的经验希望不吝赐教啊。谢谢。图1:图2:
不知道邀请谁?试试他们
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
箱线图将离群点单独列出,是该图的画法,虽然不好看,但是离群点是要有的。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
goptions reset=all
ftext='arial'
ftitle='arial/bo'hsize=9in vsize=9in
htext=2 htitle=4;footnote 'Figure5 ';symbol1 interpol=boxt00 width=8 bwidth=12 co=axis1
label = ('Weeks')
minor=none offset=(15,15) ;axis2 label=(angle=90 'AT') offset=(0,0);proc gplot data=plot at*weeks/haxis=axis1 vaxis=axis2; 之前写的一个SAS程序做箱图的,没那个离群值
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
修改下参数什么的,就OK别的方法不太会。还有一种是EXCEL的方法;用那个股价图来做
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
应该可以选择不画异常点的
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关于丁香园下载作业帮安装包
扫二维码下载作业帮
1.75亿学生的选择
以数据分布为钟形分布为例,说明均值,众数,中位数的适用条件
梦里寻忻643
 1 众数  众数是一组数据中出现次数最多的标志值,用M0表示.虽说平均数是用来说明现象的一般水平的,但在有些情况下用众数说明现象的一般水平也有很好的效果.例如,为了掌握集市上某种商品的价格水平,不必登记全部的成交量和成交额,只用该日市场上最普遍的成交价格即可.又如在确定某种商品的生产量、进货量时,要考虑哪一种规格的商品消费量最大.显然,用众数来表现给定总体的一般水平或变量数列的集中趋势具有非常直观的代表意义.并且,众数不仅可以对真正的数量标志来加以计算,还可以对品质标志来加以确定,也就是说,它既适应于变量数列,也适应急于品质数列.例如,销售量最多的服装款式或色彩,也即通常所谓的“流行款式”,就属于这种意义的众数.  对于由变量数列来确定众数,根据所掌握的资料不同,应采用不同的方法.具体方法如下:  (一)如果各标志值分布很均匀,无明显的变化,则数列无众数.  (二)如果是单项式数列或未分组的数据,则看哪一个标志值出现的次数最多便可.此时,出现次数最多的那一个标志值就是众数.  (三)由组距式数列确定众数,先根据次数的多少确定众数组,然后按公式计算  2 中位数  中位数是指将总体各单位标志值按照大小顺序排列后,处于中间位置的那个标志值,用Me表示.  中位数将变量数列分为相等的两部分,一部分的标志值小于中位数,另一部分的标志值大于中位数.用这样一个中等水平的标志值来表现数据的集中趋势,显然也具有非常直观的代表性义.在许多情况下,不易计算数值平均数时,可用中位数代表总体的一般水平,尤其是在总体标志值差异很大的情况下,中位数更加具有较强的代表性.例如,人口年龄中位数,可表示人口年龄的一般水平;集贸市场上某种商品的价格中位数,可代表该种商品价格的一般水平;在收入水平差异较大的社会,用居民收入的中位数作为收入水平的代表值更为恰当,因为它排除了极端变量值的影响.  对于中位数的确定,根据具体资料不同,采用的方法也就不同,这里分以下三种情况:  1.由未分组的数据确定中位数  根据未分组的数据确定中位数时,首先将总体各单位的标志值资料按大小顺序排列,然后按照 (n表示资料的项数)来确定中位数的位次,再根据中位数的位次找出对应的标志值即可.  3、众数、中位数、均值的关系  作为集中趋势测定值主要是众数、中位数、均值,三者之间存在着一定的数量关系,数量关系的体现取决于资料的次数分布.  1、若资料是对称分布,则众数、中位数、均值相等.  根据经验,若数据足够多,而且次数分布适度偏斜情况下,均值、中位数和众数三者间有较固定的关系.不论是在右偏还是左偏,中位数始终居于均值与众数之间.如果将均值和众数之间的距离视为1,则中位数与均值之间的距离为,中位数与众数之间的距离约占.根据这一关系,当已知其中两个代表值时,可用公式求出第三个代表值:  由对均值、中位数和众数三者关系的分析,可得出如下启示:  当数据呈现对称分布或近似对称分布时,以均值作为集中趋势的代表值最好;当分布的偏斜程度较大时,均值容易受到极端值的影响,不能很好地反映数据集中趋势,就有必要考虑使用中位数或众数.  4众数、中位数和均值的特点和应用场合  1.众数、中位数和均值的特点  (1)众数是一组数据分布的峰值,是一种位置代表值.其优点是易于理解,不受极端值的影响.当数据的分布具有明显的集中趋势时,尤其是对于偏态分布,众数的代表性比均值要好.其缺点是具有不唯一性,对于一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数.  (2)中位数是一组数据中间位置上的代表值.其特点是不受数据极端值的影响.对于具有偏态分布的数据,中位数的代表性要比均值好.  (3)均值是就全部数据计算的,它具有优良的数学性质,是实际中应用最广泛的集中趋势测度值.其主要缺点是易受数据极端值的影响,对于偏态分布的数据,均值的代表性较差.作为均值变形的调和平均数和几何平均数,是适用于特殊数据的代表值,调和平均数主要用于不能直接计算均值的数据,几何平均数则主要用于计算比率数据的平均数,这两个测度值与均值一样易受极端值的影响.  2.各种代表值应用的场合  (1)当数据呈对称分布或接近对称分布时,三个代表值相等或接近相等,这时应选择均值作为集中趋势的代表值,因为均值包含了全部数据的信息,而且易被大多数人所理解和接受;  (2)当数据为偏态分布,特别是当偏斜的程度较大时,我们应选择众数或中位数等位置代表值,这时它们的代表性要比均值好.  此外,应注意当一组数据中出现0或负数时,无法计算调和平均数或几何平均数.
为您推荐:
其他类似问题
扫描下载二维码均值众数中位数的区别联系_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
均值众数中位数的区别联系
上传于||暂无简介
你可能喜欢下载作业帮安装包
扫二维码下载作业帮
1.75亿学生的选择
一组数据的中位数与这组数据的排列顺序有关,对不对?
流星之陨9309
1,2,3;2,1,3;2,3,1;3,2,1;3,1,2;1,3,2;这6组数据的中位数都为:2,与它们的排列无关,只与中位数的定义有关.中位数的定义:一组数据按升序或按降序排列,处在中间位置(数据个数为奇数时)的那个数为中位数;当数据个数为偶数时,处在中间位置的两个数的算术平均值为该组数据的中位数.
为您推荐:
其他类似问题
扫描下载二维码

我要回帖

更多关于 分组数据中位数公式 的文章

 

随机推荐