SPSS方差分析股票回报率的时候不符合正态分布的均值和方差,回报率存在负数,请问如何正态化?

后使用快捷导航没有帐号?
方差分析及方差齐性检验的若干问答
查看: 3641|
评论: 0|原作者: cliff |来自: 网易博客
摘要: LXK的结论: 齐性检验时F越小(p越大),就证明没有差异,就说明齐,比如F=1.27,p0.05则齐,这与方差分析均数时F越大约好相反。 LXK注: 方差(MS或s2)=离均差平方和/自由度(即离均差平方和的均数) 标准差=方差的平 ...
LXK的结论:
齐性检验时F越小(p越大),就证明没有差异,就说明齐,比如F=1.27,p&0.05则齐,这与方差分析均数时F越大约好相反。
方差(MS或s2)=离均差平方和/自由度(即离均差平方和的均数)
标准差=方差的平方根(s)
F=MS组间/MS误差=(处理因素的影响+个体差异带来的误差)/个体差异带来的误差
=================
F检验为什么要求各比较组的方差齐性?
之所以需要这些前提条件,是因为必须在这样的前提下所计算出的t统计量才服从t分布,而t检验正是以t分布作为其理论依据的检验方法。
在方差分析的F检验中,是以各个实验组内总体方差齐性为前提的,因此,按理应该在方差分析之前,要对各个实验组内的总体方差先进行齐性检验。如果各个实验组内总体方差为齐性,而且经过F检验所得多个样本所属总体平均数差异显著,这时才可以将多个样本所属总体平均数的差异归因于各种实验处理的不同所致;如果各个总体方差不齐,那么经过F检验所得多个样本所属总体平均数差异显著的结果,可能有一部分归因于各个实验组内总体方差不同所致。
简单地说就是在进行两组或多组数据进行比较时,先要使各组数据符合正态分布,另外就是要使各组数据的方差相等(齐性)。
=================
在SPSS中,如果进行方差齐性检验呢?命令是什么?
方差分析(Anaylsis of Variance, ANOVA)要求各组方差整齐,不过一般认为,如果各组人数相若,就算未能通过方差整齐检验,问题也不大。
One-Way ANOVA对话方块中,点击Options…(选项…)按扭, 勾Homogeneity-of-variance即可。它会产生 Levene、Cochran C、Bartlett-Box F等检验值及其显著性水平P值,若P值&于0.05,便拒绝方差整齐的假设。
顺带一提,Cochran和Bartlett检定对非正态性相当敏感,若出现「拒绝方差整齐」的检测结果,或因这原因而做成。
=================
用spss处理完数据的显示结果中,F值,t值及其显著性(sig)都分别是解释什么的?
一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。
通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较,我们可以知道在多少%的机会下会得到目前的结果。倘若经比较后发现,出现这结果的机率很少,亦即是说,是在机会很少、很罕有的情况下才出现;那我们便可以有信心的说,这不是巧合,是具有统计学上的意义的(用统计学的话讲,就是能够拒绝虚无假设null hypothesis,Ho)。相反,若比较后发现,出现的机率很高,并不罕见;那我们便不能很有信心的直指这不是巧合,也许是巧合,也许不是,但我们没能确定。
F值和t值就是这些统计检定值,与它们相对应的概率分布,就是F分布和t分布。统计显著性(sig)就是出现目前样本这结果的机率。
至於具体要检定的内容,须看你是在做哪一个统计程序。
【举一个例子】
比如,你要检验两独立样本均数差异是否能推论至总体,而行的t检验。
两样本(如某班男生和女生)某变量(如身高)的均数并不相同,但这差别是否能推论至总体,代表总体的情况也是存在著差异呢?会不会总体中男女生根本没有差别,只不过是你那麼巧抽到这2样本的数值不同?
为此,我们进行t检定,算出一个t检定值,与统计学家建立的以「总体中没差别」作基础的随机变量t分布进行比较,看看在多少%的机会(亦即显著性sig值)下会得到目前的结果。 若显著性sig值很少,比如&0.05(少於5%机率),亦即是说,「如果」总体「真的」没有差别,那麼就 只有在机会很少(5%)、很罕有的情况下,才会出现目前这样本的情况。
虽然还是有5%机会出错,但我们还是可以「比较有信心」的说:目前样本中这情况(男女生出现差异的情况)不是巧合,是具统计学意义的,「总体中男女生不存差异」的虚无假设应予拒绝,简言之,总体应该存在著差异。
每一种统计方法的检定的内容都不相同,同样是t-检定,可能是上述的检定总体中是否存在差异,也同能是检定总体中的单一值是否等於0或者等於某一个数值。
至於F-检定,方差分析(或译变异数分析,Analysis of Variance),它的原理大致也是上面说的,但它是透过检视变量的方差而进行的。它主要用于:均数差别的显著性检验、分离各有关因素并估计其对总变异的作用、分析因素间的交互作用、方差齐性(Equality of Variances)检验等情况。
=================
方差齐性检验在什么情况下进行?为什么要进行方差齐性检验?
如果需要进行方差分析,就要进行方差齐性检验,即若组间方差不齐则不适用方差分析。但可通过对数变换、平方根变换、倒数变换、平方根反正弦变换等方法变换后再进行方差齐性检验,若还不行只能进行非参数检验.
除了对两个研究总体的总体平均数的差异进行显著性检验以外,我们还需要对两个独立样本所属总体的总体方差的差异进行显著性检验,统计学上称为方差齐性(相等)检验。
方差齐性实际上是指要比较的两组数据的分布是否一致,通俗的来说就是两者是否适合比较。
=================
为什么要做方差齐性和正态检验?
主要是确认数据的合理性(不具备相关性)而已。正态分布以及近似正态分布是应用该分析的基本条件……
构造的统计量需要样本有正态等方差的条件,或者说是这样的条件情况下的一种判断,失去了这个前提,后期的判断分析都是空中楼阁。
就像讨论如何成为一个好男人,那么前提他必须是一个男人而且方差齐性检验的Bartlett方法也是以正太分布为前提的,其所构造的卡方统计量必须满足样本为正态分布。
=================
F检验与方差齐性检验
在方差分析的F检验中,是以各个实验组内总体方差齐性为前提的,因此,按理应该在方差分析之前,要对各个实验组内的总体方差先进行齐性检验。如果各个实验组内总体方差为齐性,而且经过F检验所得多个样本所属总体平均数差异显著,这时才可以将多个样本所属总体平均数的差异归因于各种实验处理的不同所致;如果各个总体方差不齐,那么经过F检验所得多个样本所属总体平均数差异显著的结果,可能有一部分归因于各个实验组内总体方差不同所致。
但是,方差齐性检验也可以在F检验结果为多个样本所属总体平均数差异显著的情况下进行,因为F检验之后,如果多个样本所属总体平均数差异不显著,就不必再进行方差齐性检验。
=================
Levene方差齐性检验也称为Levene检验(Levene's Test).
由H.Levene在1960年提出[1].M.B.Brown和A.B.Forsythe在1974年对Levene检验进行了扩展[2],使对原始数据的数据转换不但可以使用数据与算术平均数的绝对差,也可以使用数据与中位数和调整均数(trimmed mean)的绝对差.这就使得Levene检验的用途更加广泛.Levene检验主要用于检验两个或两个以上样本间的方差是否齐性.要求样本为随机样本且相互独立.国内常见的Bartlett多样本方差齐性检验主要用于正态分布的资料,对于非正态分布的数据,检验效果不理想.Levene检验既可以用于正态分布的资料,也可以用于非正态分布的资料或分布不明的资料,其检验效果比较理想.
=================
方差分析的条件之一为方差齐,即各总体方差相等。因此在方差分析之前,应首先检验各样本的方差是否具有齐性。常用方差齐性检验(test for homogeneity of variance)推断各总体方差是否相等。本节将介绍多个样本的方差齐性检验,本法由Bartlett于1937年提出,称Bartlett法。该检验方法所计算的统计量服从分布。
用自由度查界值表,若值大于等于界值,则P值小于等于相应的概率,反之,P值大于相应的概率。如果未经校正的值小于界值,则校正后的值更小,可不必再计算校正值。
例5.7对照组、A降脂药组、B降脂药组和C降脂药组家兔的血清胆固醇含量(mmol/L)的均数分别为5.845、2.853、2.972和1.768,方差分别为5.941、2.370、0.517和0.581,样本含量分别为6、6、6和7,问四样本的方差是否齐同?
刚表态过的朋友 ()君,已阅读到文档的结尾了呢~~
广告剩余8秒
文档加载中
第六章SPSS的方差分析,spss的方差分析,spss中的方差分析,spss的单因素方差分析,spss方差分析,spss方差分析步骤,单因素方差分析spss,spss双因素方差分析,spss多因素方差分析,两因素方差分析 spss
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
第六章SPSS的方差分析
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer--144.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口如果方差不齐,能否用SPSS做单因素方差分析?
如果方差不齐,能否用SPSS做单因素方差分析?
09-03-25 &
one-way ANOVA方差分析项的post Hoc test分别有二选项: 1.假设方差齐时有一系列的分析方法可选。2.假设方差不齐时又有一系列的分析方法可选。再者,为保证统计准确,如果方差不齐,可以进行对数,倒数或函数的转换,选择适当的转换形式,直到齐性检验变为不显著。如果还不行就只能用非参数的单因素分析。如果非要进行方差分析则需要把means±SD范围外的数据剔除。实际操作中对方差齐性等适用条件的把握:1.单因素方差分析:根据BOX的研究结果,在单因素方差分析中,如果各组的例数相同(即均衡),或总体呈正态分布,则方差分析模型对方差略微不齐有一定的耐受力,只要最大与最小方差之比小于3,分析结果都是稳定的2.单元格内无重复数据的方差分析分析:以配伍设计的方差分析最为典型,此时不需要考虑正态性和方差齐性问题,原因在于正态性和方差齐性的考察是以单元格为基本单位的,此时每个格子中只有一个元素,当然没法分析了.除配伍设计的方差分析外,交叉设计,正交设计等也可以出现无重复数据的情况.但必须指出,这里只是因条件不足,无法考察适用条件,而不是说可以完全忽视这两个问题.如果根据专业知识认为可能在不同单元格内正态性,方差齐性有问题,则应当避免使用这种无重复数据的设计方案.3.有重复数据的多因素方差分析:由于正态性,方差齐性的考察以单元格为基本单位,此时单元格数目往往很多,平均每个单元格内的样本粒数实际上比较少。此时实际上很难检验出差别;另一方面,也可能只是因为极个别单元格方差不齐而单质检验不能通过。根据实际经验,实际在多因素方差分析中,极端值的影响远远大于方差齐性等问题的影响,因此实际分析中可以直接考察因变量的分布情况,如果数据分布不是明显偏态,不存在极端值,而一般而言方差齐性和正态齐性不会有太大问题,而且也可以基本保证单元格内无极端值.因此在多因素方差分析中,方差齐性往往只限于理论讨论,但对于较重要的研究,则建模后的残差分析是非常重要的。
请登录后再发表评论!spss实验-方差分析&&categories:&&author:来源:互联网1.帮助学生深入了解方差及方差分析的基本概念,掌握方差分析的基本思想和原理 2.掌握方差分析的过程。 3.增强学生的实践能力,使学生能够利用SPSS统计软件,熟练进行单因素方差分析、两因素方差分析等操作,激发学生的学习兴趣,增强自我学习和研究的能力。在现实的生产和经营管理过程中,影响产品质量、数量或销量的因素往往很多。例如,农作物的产量受作物的品种、施肥的多少及种类等的影响;某种商品的销量受商品价格、质量、广告等的影响。为此引入方差分析的方法。 方差分析也是一种假设检验,它是对全部样本观测值的变动进行分解,将某种控制因素下各组样本观测值之间可能存在的由该因素导致的系统性误差与随即误差加以比较,据以推断各组样本之间是否存在显著差异。若存在显著差异,则说明该因素对各总体的影响是显著的。 方差分析有3个基本的概念:观测变量、因素和水平。观测变量是进行方差分析所研究的对象;因素是影响观测变量变化的客观或人为条件;因素的不同类别或不通取值则称为因素的不同水平。在上面的例子中,农作物的产量和商品的销量就是观测变量,作物的品种、施肥种类、商品价格、广告等就是因素。在方差分析中,因素常常是某一个或多个离散型的分类变量。 根据观测变量的个数,可将方差分析分为单变量方差分析和多变量方差分析;根据因素个数,可分为单因素方差分析和多因素方差分析。在SPSS中,有One-way ANOVA(单变量-单因素方差分析)、GLM Univariate(单变量多因素方差分析);GLM Multivariate (多变量多因素方差分析),不同的方差分析方法适用于不同的实际情况。本节仅练习最为常用的单因素单变量方差分析。 单因素方差分析也称一维方差分析,对两组以上的均值加以比较。检验由单一因素影响的一个分析变量由因素各水平分组的均值之间的差异是否有统计意义。并可以进行两两组间均值的比较,称作组间均值的多重比较。主要采用One-way ANOVA过程。 采用One-way ANOVA过程要求:因变量属于正态分布总体,若因变量的分布明显是非正态,应该用非参数分析过程。若对被观测对象的试验不是随机分组的,而是进行的重复测量形成几个彼此不独立的变量,应该用Repeated Measure菜单项,进行重复测量方差分析,条件满足时,还可以进行趋势分析。 假设某汽车经销商为了研究东部、西部和中部地区市场上汽车的销量是否存在显著差异,在每个地区随机抽取几个城市进行调查统计,调查数据放置于数据文件“汽车销量调查.sav”中。在SPSS中试验该检验的步骤如下:步骤1:选择菜单【分析】→【比较均值】→【单因素方差分析】,依次将观测变量销量移入因变量列表框,将因素变量地区移入因子列表框。 图4.1 One-Way ANOVA对话框单击两两比较按钮,如图4.2,该对话框用于进行多重比较检验,即各因素水平下观测变量均值的两两比较。方差分析的原假设是各个因素水平下的观测变量均值都相等,备择假设是各均值不完全相等。假如一次方差分析的结果是拒绝原假设,我们只能判断各观测变量均值不完全相等,却不能得出各均值完全不相等的结论。各因素水平下观测变量均值的更为细致的比较就需要用多重比较检验。
图4.2 两两比较对话框 假定方差齐性选项栏中给出了在观测变量满足不同因素水平下的方差齐性条件下的多种检验方法。这里选择最常用的LSD检验法;未假定方差齐性选项栏中给出了在观测变量不满足方差齐性条件下的多种检验方法。这里选择Tamhane’s T2检验法;Significance level输入框中用于输入多重比较检验的显示性水平,默认为5%。单击选项按钮,弹出options子对话框,如图所示。在对话框中选中描述性复选框,输出不同因素水平下观测变量的描述统计量;选择方差同质性检验复选框,输出方差齐性检验结果;选中均值图复选框,输出不同因素水平下观测变量的均值直线图。在主对话框中点击ok按钮,可以得到单因素分析的结果。试验结果分析:表4.1给出了不同地区汽车销量的基本描述统计量以及95%的置信区间。 图4.3 选项子对话框 表4.1 各个地区汽车销量描述统计量
Descriptives销量NMeanStd. DeviationStd. Error95% Confidence Interval for MeanMinimumMaximumLower BoundUpper Bound西10157.9022.2787.045141.96173.84120194中9176.4419.7176.572161.29191.60135198东7196.1430.92711.689167.54224.75145224Total26174.6227.8455.461163.37185.86120224表4.2给出了Levene方差齐性检验结果。从表中可以看到,Levene统计量对应的p值大于0.05,所以得到不同地区汽车销量满足方差齐性的结论。 表4.2 各地区汽车销量方差齐性检验表
Test of Homogeneity of VariancesLevene Statisticdf1df2Sig.1.262223.302表4.3是单因素方差分析,输出的方差分析表解释如下:总离差SST=,组间平方和SSR=,组内平方和或残差平方和SSE=,相应的自由度分别为25,2,23;组间均方差MSR=,组内均方差578.956,F=5.241,由于p=0.013&0.05说明在α=0.05显著性水平下,F检验是显著的。即认为各个地区的汽车销量并不完全相同。 表4.3 单因素方差分析结果
ANOVA 销量Sum of SquaresdfMean SquareFSig.Between Groups25.241.013Within Groups23578.956Total25表4.4 多重比较检验结果
Multiple Comparisons Dependent Variable: 销量(I) 地区(J) 地区Mean Difference (I-J)Std. ErrorSig.95% Confidence IntervalLower BoundUpper BoundLSD西中-18.54411.055.107-41.414.33东-38.243(*)11.858.004-62.77-13.71中西18.54411.055.107-4.3341.41东-19.69812.126.118-44.785.39东西38.243(*)11.858.00413.7162.77中19.69812.126.118-5.3944.78Tamhane西中-18.5449.635.199-44.056.96东-38.24313.648.054-77.10.61中西18.5449.635.199-6.9644.05东-19.69813.410.436-58.3118.91东西38.24313.648.054-.6177.10中19.69813.410.436-18.9158.31*
The mean difference is significant at the .05 level. 如前所述,拒绝单因素方差分析原假设并不能得出各地区汽车销量均值完全不等的结论。各地区销量均值的两两比较要看表4.4所示的多重比较检验结果。表中上半部分为LSD检验结果,下半部分为Tamhane检验结果。由于方差满足齐性,所以这里应该看LSD检验结果。表中的Mean difference列给出了不同地区汽车销量的平均值之差。其中后面带“﹡”号的表示销量有显著差异,没有带“﹡”号的表示没有显著差异。可以看出,东部和西部汽车销量存在显著差异,而中部与东部、中部与西部汽车销量并没有什么显著差异。这一结论也可以从表中Sig列给出的p值大小得到印证。1. 用SPSS进行单因素方差分析。某个年级有三个小班,他们进行了一次数据考试,现从各班随机地抽取了一些学生,记录其成绩如表。原始数据文件保存为“数学考试成绩.sav”。试在显著性水平0.05下检验各班级的平均分数有无显著差异。 数学考试成绩表ⅠⅡⅢ7366887768418960783179598245487856684393916291538036517671797377859671157879748087757687568597892.某学校给3组学生以3种不同方式辅导学习,一个学期后,学生独立思考水平提高的成绩如表所示。 学生独立思考水平提高的成绩方式137424243414245464140方式249484848474546474849方式333333532313534323233问:该数据中的因变量是什么?因素又是什么?如何建立数据文件?对该数据进行方差分析,检验3种方式的影响是否存在显著差异?近期文章
分类目录选择分类目录书路&&(10)儿童画&&(111)&&&儿童作品&&(82)&&&儿童画教程&&(24)原创&&(126)&&&0基础编程&&(23)&&&android&&(9)&&&hadoop&&(18)&&&java原创&&(2)&&&livewriter&&(11)&&&nginx&&(52)资料&&(952)&&&android资料&&(84)&&&java资料&&(75)&&&linux资料&&(36)&&&mysql资料&&(34)&&&nginx资料&&(17)&&&svn&&(9)&&&wordpress&&(48)&&&搜索资料&&(45) 文章归档 选择月份 2017年四月 &(20) 2017年三月 &(18) 2017年二月 &(5) 2017年一月 &(8) 2016年十二月 &(8) 2016年十一月 &(1) 2016年十月 &(10) 2016年九月 &(5) 2016年八月 &(6) 2016年七月 &(6) 2016年六月 &(9) 2016年五月 &(14) 2016年四月 &(6) 2016年三月 &(21) 2016年二月 &(11) 2016年一月 &(15) 2015年十二月 &(18) 2015年十一月 &(14) 2015年十月 &(6) 2015年九月 &(6) 2015年八月 &(7) 2015年七月 &(11) 2015年六月 &(19) 2015年五月 &(26) 2015年四月 &(19) 2015年三月 &(35) 2015年二月 &(38) 2015年一月 &(20) 2014年十二月 &(8) 2014年十一月 &(8) 2014年十月 &(3) 2014年九月 &(3) 2014年八月 &(3) 2014年七月 &(4) 2014年六月 &(3) 2014年五月 &(7) 2014年四月 &(10) 2014年三月 &(8) 2014年二月 &(8) 2014年一月 &(11) 2013年十二月 &(11) 2013年十一月 &(9) 2013年十月 &(40) 2013年九月 &(79) 2013年八月 &(50) 2013年七月 &(68) 2013年六月 &(50) 2013年五月 &(59) 2013年四月 &(65) 2013年三月 &(59) 2013年二月 &(20) 2013年一月 &(59) 2012年十二月 &(52) 2012年十一月 &(91) 2012年十月 &(23)

我要回帖

更多关于 正态分布的期望和方差 的文章

 

随机推荐