两独立样本率比较单样本假设检验验分析思路

君,已阅读到文档的结尾了呢~~
第章两样本定量资料假设检验,双样本假设检验,假设检验样本量,第八章 假设检验,假设检验 第七章,双样本等方差假设,双样本异方差假设,需要先假设样本空间中,需要先假设样本空间,假设有如下4个样本表
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
第章两样本定量资料假设检验
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer--144.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口统计学两个独立样本T检验_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
统计学两个独立样本T检验
上传于||暂无简介
阅读已结束,如果下载本文需要使用1下载券
想免费下载本文?
定制HR最喜欢的简历
你可能喜欢推荐这篇日记的豆列
······【数据分析 R语言实战】学习笔记 第七章 假设检验及R实现 - 推酷
【数据分析 R语言实战】学习笔记 第七章 假设检验及R实现
假设检验及R实现
7.1假设检验概述
对总体参数的具体数值所作的陈述,称为假设;再利用样本信息判断假设足否成立,这整个过程称为假设检验。
7.1.1理论依据
假设检验之所以可行,其理沦背景是小概率理论。小概率事件在一次试验中儿乎是不可能发生的,但是它一以发生,我们就有理由拒绝原假设:反之,小概率事件没有发生,则认为原假设是合理的。这个小概率的标准由研究者事先确定,即以所谓的显著性水平α(0&α&1)作为小概率的界限,α的取值与实际问题的性质相关,通常我们取α=0.1, 0.05或0.01,假设检验也称为显著性检验。
7 .1.2检验步骤
(1)&&& 提出假设
(2)&&& 确定检验统计量,计算统计量的值
(3)&&& 规定显著性水平,建立检验规则
(4)&&& 作出统计决策
临界值规则:
双侧检验:|统计量|&临界值时,拒绝H 0
左侧检验:统计量&=临界值时,拒绝H 0
右侧检验:统计量&临界值时,拒绝H 0
在一个假设检验问题中,拒绝原假设H0,的最小显著性水平称为检验的p值。p值可以告诉我们,如果原假设是正确的话,我们得到目前这个样本统计值的可能性有多人,如果这个可能性很小,就应该拒绝原假设。也就是说,P值越小,拒绝H0的可能性越大。在显著性水平α下,P值规则为:如果P≤α,则拒绝H 0 ;如果P&a,则不拒绝原假设。
7.1.3两类错误
7.2单正态总体的检验
单正态总体的假设检验方法:
7.2.1均值μ的检验
(1) σ 2 已知
R自带的函数中只提供了t检验的函数t.test(),而没有Z检验的函数,自己编写函数z.test(),用于计算z统计量的值以及P值:
& z.test=function(x,mu,sigma,alternative=&two.sided&){
n=length(x)
result=list()
#构造一个空的list,用于存放输出结果
mean=mean(x)
z=(mean-mu)/(sigma/sqrt(n))
#计算z统计量的值
options(digits=4)
#结果显示至小数点后4位
result$mean=result$z=z
#将均值、z值存入结果
result$P=2*pnorm(abs(z),lower.tail=FALSE)
#根据z计算P值
#若是单侧检验,重新计算P值
if(alternative==&greater&) result$P=pnorm(z,lower.tail=FALSE)
else if(alternative==&less&) result$P=pnorm(z)
BSDA包提供了函数z.test( ),它可以对基于正态分布的单样本和双样本进行假设检验,其使用方法如下:
z.test(x,y=NULL,alternative=&two.sided&,mu=0,sigma.x=NULL,
sigma.y=NULL, onf.level = 0.95)
其中,x和Y为数值向量,默认y=NULL,即进行单样本的假设检验:alternative用于指定求置信区问的类型,默认为two.sided&表示求双尾的置信区间,为less则求置信上限,greater求置信F限:mu表示均值,仅在假设检验中起作用,默认为0;sigma.x和sigma.y分别指定两个样本总体的标准差。
东方财富数据中心可以获得2012年各月北京市的新建住宅价格指数,是否服从均值为102.4、方差为0.45(标准差为0.67)的正态分布
& bj=c(102.5,102.4,102.0,101.8,101.8,102.1,102.3,102.5,102.6,102.8,103.4,104.2)
& z.test(x=bj,mu=102.4,sigma=0.67,alternative=&two.sided&)
[1] 0.6894
[1] 0.4906
使用程序包BSDA中的函数z.test()
& library(BSDA)
& z.test(x=bj,mu=102.4,sigma=0.67,alternative=&two.sided&)
[1] 0.6894
[1] 0.4906
检验的结果是,由于P =0.4906& a =0.05,因此在0.05的显署性水平下,不能拒绝原假设,认为2012年各月北京的新建住宅价格指数服从均值为102.4的正态分布。
(2)σ 2 未知
直接调用t检验函数t.test()即可:
t.test(x, y = NULL,alternative = c(&two.sided&, &less&, &greater&),mu = 0, paired = FALSE, var.equal = FALSE,conf.level = 0.95, ...)
其中,x为样本数据,若仅出现x,则进行单样本t检验:若x和Y同时输入,则做双样本t检验;alternative用于指定所求置信区间的类型,默认为two.sided,表示求双尾的置信区问,若为less则求置信上限,greater求置信下限:mu表示均值,表示原假设中事先判断的均值,默认值为0 ;
paired是逻辑值,表示是否进行配对样本t检验,默认为不配对;var.equal也是逻辑值,表示双样本检验时两个总体的方差是否相等;另外,这个函数还可以直接计算置信IX问,conf.level用来表示区间的置信水平。
& t.test(x=bj,mu=102.4,alternative=&less&)
One Sample t-test
t = 0.67, df = 11, p-value = 0.7
alternative hypothesis: true mean is less than 102.4
95 percent confidence interval:
-Inf 102.9
sample estimates:
7.2.2方差σ2的检验
(1) μ已知
(2) μ未知
R中没有直接的函数可以做样本方差的卡方检验(只有检验卡方分布的函数),所以我们把上述两种情形写在同一个函数chisq.var.test()中,调用它就可以直接做各种情形的单样本方差检验。应用到2012年北京市新建住宅价格指数的案例中,如果样本方差保持在一定范围内,则说明房价比较稳定,l}}此我们在0.05的显著性水平下检验总体方差是否不超过0.25。
& chisq.var.test=function(x,var,mu=Inf,alternative=&two.sided&){
n=length(x)
#均值未知时的自由度
#均值未知时的方差估计值
#总体均值已知的情况
if(mu&Inf){df=n;v=sum((x-mu)^2)/n}
chi2=df*v/var
#卡方统计量
options(digits=4)
result=list()
#产生存放结果的列表
result$df=result$var=v;result$chi2=chi2;
result$P=2*min(pchisq(chi2,df),pchisq(chi2,df,lower.tail=F))
#若是单侧检验,重新计算P值
if(alternative==&greater&) result$P=pchisq(chi2,df,lower.tail=F)
else if(alternative==&less&) result$P=pchisq(chi2,df)
& chisq.var.test(bj,0.25,alternative=&less&)
[1] 0.4752
[1] 0.9656
检验的结果为P值非常大,远大于a=0.05 ,因此不能拒绝原假设,说明新建住宅价格指数的方差大于0.25,变动很大。
7.3两正态总体的检验
单正态总体的假设检验方法:
7.3.1均值差的检验
(1)两个总体的方差已知
编写均值差的正态检验函数z.test2()
& z.test2=function(x,y,sigma1,sigma2,alternative=&two.sided&){
n1=length(x);n2=length(y)
result=list()
#构造一个空的list,用于存放输出结果
mean=mean(x)-mean(y)
z=mean/sqrt(sigma1^2/n1+sigma2^2/n2)
#计算z统计量的值
options(digits=4)
#结果显示至小数点后4位
result$mean=result$z=z
#将均值、z值存入结果
result$P=2*pnorm(abs(z),lower.tail=FALSE)
#根据z计算P值
#若是单侧检验,重新计算P值
if(alternative==&greater&) result$P=pnorm(z,lower.tail=FALSE)
else if(alternative==&less&) result$P=pnorm(z)
程序包BDSA中的函数z.test()可以快速地实现方差己知时两总体均值差的假设检验。
以Bamberger's百货公司的数据为例,公司实施延长营业时间的改革计划,假设已知改革前后销售额的总体标准差分别为8和12,检验这项措施对销售业绩是否有显著影响。
& sales=read.table(&D:/Program Files/RStudio/sales.txt&,header=T)
& attach(sales)
& z.test2(prior,post,8,12,alternative=&less&)
[1] -24.54
[1] -8.843
[1] 4.678e-19
使用函数z.test()可以得到相同的结果,同时还可以输出置信区间估计。
& z.test(prior,post,sigma.x=8,sigma.y=12,alternative=&less&)
Two-sample z-Test
prior and post
z = -8.8, p-value &2e-16
alternative hypothesis: true difference in means is less than 0
95 percent confidence interval:
sample estimates:
mean of x mean of y
表明延长营业时间后销售额更高
(2)两个总体的方差未知但相等
(3)两个总体的方差未知且不等
& t.test(prior,post,var.equal=FALSE,alternative=&less&)
Welch Two Sample t-test
prior and post
t = -8.4, df = 44, p-value = 6e-11
alternative hypothesis: true difference in means is less than 0
95 percent confidence interval:
-Inf -19.62
sample estimates:
mean of x mean of y
7.3.2成对数据的t检验
& x=c(117,127,141,107,110,114,115,138,127,122)
& y=c(113,108,120,107,104,98,102,132,120,114)
& t.test(x,y,paired=TRUE,alternative=&greater&)
Paired t-test
t = 4.6, df = 9, p-value = 7e-04
alternative hypothesis: true difference in means is greater than 0
95 percent confidence interval:
sample estimates:
mean of the differences
p远小于a=0.05 ,拒绝原假设,说明药物组均值明显降低,该药物有降压作用。
7.3.3两总体方差的检验
R中的函数var.rest()做方差比较的F检验以及相应的区问估计
& var.test(prior,post)
F test to compare two variances
prior and post
F = 0.39, num df = 26, denom df = 26, p-value = 0.02
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
sample estimates:
ratio of variances
检验结果的P =0.01914&a=0.05,故拒绝原假设,说明延长营业时间前后销售额的方差不相同。
7.4比率的检验
7.4.1比率的二项分布检验
在R中使用函数binom.test()完成:
binom.test(x,n,p=0.5,alternative=c(&two.sided&,&less&,&greater&),conf.level = 0.95)
2000户家庭中人均不足5平米的困难户有214个,政府希望将总体中困难户的比率控制在10%左右,判断这一目标是否达到。
& binom.test(214,2000,p=0.1)
Exact binomial test
214 and 2000
number of successes = 210, number of trials = 2000,
p-value = 0.3
alternative hypothesis: true probability of success is not equal to 0.1
95 percent confidence interval:
sample estimates:
probability of success
由于p=0.2966&a=0.05,故不能拒绝原假设,说明总体居民的困难户比率保持在10%左右。检验结果还给出了置信区问和样本比率估计值0.107
7.4.2比率的近似检验
大样本,可以使用正态检验方法代替二项分布:
& prop.test(214,2000,p=0.1)
1-sample proportions test with continuity correction
214 out of 2000, null probability 0.1
X-squared = 1, df = 1, p-value = 0.3
alternative hypothesis: true p is not equal to 0.1
95 percent confidence interval:
sample estimates:
7.5非参数的检验
7.5.1总体分布的c2检验
(1)理论分布已知
R软件中提供了实现Pearson拟合优度卡方检验的函数chisq.test(),其调用格式为
chisq.test(x, y = NULL, correct = TRUE,p = rep(1/length(x), length(x)), rescale.p = FALSE,simulate.p.value = FALSE, B = 2000)
& bj=c(102.5,102.4,102.0,101.8,101.8,102.1,102.3,102.5,102.6,102.8,103.4,104.2)
& hist(bj)
函数cut()用于将变量的区域分成若干区间,其调用格式为
cut(x, breaks, labels = NULL,
include.lowest = FALSE, right = TRUE, dig.lab = 3,
ordered_result = FALSE, ...)
函数table()可以计算因子合并后的个数,以列联表的形式展示出每个区间的数据频数。
table(..., exclude = if (useNA == &no&) c(NA, NaN), useNA = c(&no&,
&ifany&, &always&), dnn = list.names(...), deparse.level = 1)
& A=table(cut(bj,breaks=c(101.4,101.9,102.4,102.9,104.5)))
#两个函数嵌套使用
(101.4,101.9] (101.9,102.4] (102.4,102.9] (102.9,104.5]
& br=c(101.5,102,102.5,103,104.5)
& p=pnorm(br,mean(bj),sd(bj))
#注意pnorm()计算出的是分布函数
& p=c(p[1],p[2]-p[1],p[3]-p[2],1-p[3])
& options(digits=2)
[1] 0.067 0.153 0.261 0.519
& chisq.test(A,p=p)
Chi-squared test for given probabilities
X-squared = 7, df = 3, p-value = 0.06
总体分布的卡方检验结果为P=0.05849& a =0.05 ,因此在0.05的显著性水平下,不能够拒绝原假设,可以认为北京市新建住宅价格指数服从正态分布。
7.5.2Kolmogrov-Smirnov检验
(1)单样本KS检验
Kolmogorov-Smirnov检验是用来检验一个数据的观测经验分布是否是已知的理论分布,当两者之间的差距很小时可以认为该样本取自己知的理论分布。KS检验通过经验分布与假设分布的上确界来构造统计量,因此它可以检验任何分布类型:
ks.test(x, y, ...,
alternative = c(&two.sided&, &less&, &greater&),
exact = NULL)
对一台设备进行寿命检验,一记录10次无故障工作时间,检验其是否服从参数为1/1500的指数分布
& X=c(420,500,920,50,00,2350)
& ks.test(X,&pexp&,1/1500)
#pxep为指数分布累积分布函数的名称,1/1500为指数分布参数
One-sample Kolmogorov-Smirnov test
D = 0.3, p-value = 0.3
alternative hypothesis: two-sided
单样本KS检验的结果为P值=0.2654,其大于显著性水平0.05,因此不能拒绝原假设,说明该设备的寿命服从λ=1/1500的指数分布。
(2)两样本KS检验
假设有分别来自两个独立总体的两样本,要想检验它们背后的总体分布是否相同,就可以进行两独立样本的KS检验。原理与单样本相同,只需要把原假设中的分布换成另一个样本的经验分布即可。
有分别从两个总体抽取的25个和20个观测值的随机样本,判断它们是否来自同一分布。
& xx=c(0.61,0.29,0.06,0.59,-1.73,-0.74,0.51,-0.56,0.39,1.64,0.05,-0.06,0.64,-0.82,0.37,1.77,1.09,-1.28,2.36,1.31,1.05,-0.32,-0.40,1.06,-2.47)
& yy=c(2.20,1.66,1.38,0.20,0.36,0.00,0.96,1.56,0.44,1.50,-0.30,0.66,2.31,3.29,-0.27,-0.37,0.38,0.70,0.52,-0.71)
& ks.test(xx,yy)
Two-sample Kolmogorov-Smirnov test
D = 0.2, p-value = 0.5
alternative hypothesis: two-sided
(3) KS检验与卡方检验的比较
KS检验与卡方检验的相同之处在一于它们都是采用实际频数和期望频数之差进行检验。但不同点在于,卡方检验必须先将数据分组才能获得实际的观测频数,而KS检验法可以直接对原始数据的n个观测值进行检验,所以它对数据的利用更完整。另外在使用范围上,卡方检验主要用于分类数据,而KS检验主要用于有计量单位的连续和定量数据。
KS检验作为一种非参数方法,具有稳健性。它不依赖于均值的位置,对数据量纲不敏感,一般来讲比卡方检验更有效。与其他参数检验不同,KS检验的适用范围非常广,不像t检验一样局限于正态分布(当数据偏离较大时t检验会失效)。
已发表评论数()
请填写推刊名
描述不能大于100个字符!
权限设置: 公开
仅自己可见
正文不准确
标题不准确
排版有问题
主题不准确
没有分页内容
图片无法显示
视频无法显示
与原文不一致出自 MBA智库百科()
T检验(T Test)
  T检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n&30),总体标准差σ未知的资料。
  T检验是用于小样本(小于30)的两个平均值差异程度的检验方法。它是用T分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。
  T检验是为了观测酿酒质量而发明的。戈斯特在位于都柏林的健力士酿酒厂担任统计学家。戈斯特于1908年在Biometrika上公布T检验,但因其老板认为其为而被迫使用笔名(学生)。
  T检验的适用条件:正态分布资料
  目的:比较样本均数
所代表的未知总体均数μ和已知总体均数&0。
  计算公式:
  t统计量:
  自由度:v=n - 1
  适用条件:
已知一个总体均数;
可得到一个样本均数及该样本标准误;
  (3) 样本来自正态或近似正态总体。
难产儿出生体重
  一般婴儿出生体重&0 = 3.30(大规模调查获得),问相同否?
  解:1.建立假设、确定检验水准α
  H0:& = &0 (难产儿与一般婴儿出生体重的总均数相等;H0无效假设,null hypothesis)
  (难产儿与一般婴儿出生体重的总均数不等;H1备择假设,alternative hypothesis,)
  双侧检验,检验水准:& = 0.05
   2.计算检验统计量
  3.查相应界值表,确定P值,下结论
  查附表1: t0.05 / 2.34 = 2.032,t = 1.77,t & t0.05 / 2.34,P & 0.05,按& = 0.05水准,不拒绝H0,两者的差别无统计学意义,尚不能认为难产儿平均出生体重与一般婴儿的出生体重不同
  配对设计:将受试对象的某些重要特征按相近的原则配成对子,目的是消除混杂因素的影响,一对观察对象之间除了处理因素/研究因素之外,其它因素基本齐同,每对中的两个个体随机给予两种处理。
两种同质对象分别接受两种不同的处理,如性别、年龄、体重、病情程度相同配成对。
同一受试对象或同一样本的两个部分,分别接受两种不同的处理
自身对比。即同一受试对象处理前后的结果进行比较。
  目的:判断不同的处理是否有差别
  计算公式及意义:
  自由度:v=对子数-1
  适用条件:配对资料
  1、建立虚无假设H0:&1 = &2,即先假定两个总体平均数之间没有显著差异;
  2、计算统计量t值,对于不同类型的问题选用不同的计算方法;
  1)如果要评断一个总体中的小样本平均数与总体平均值之间的差异程度,其统计量t值的计算公式为:
  2)如果要评断两组样本平均数之间的差异程度,其统计量t值的计算公式为:
  3、根据自由度df=n-1,查t值表,找出规定的t理论值并进行比较。理论值差异的为0.01级或0.05级。不同自由度的显著水平理论值记为t(df)0.01和t(df)0.05
  4、比较计算得到的t值和理论t值,推断发生的概率,依据下表给出的t值与差异显著性关系表作出判断。
T值与差异显著性关系表
tP值差异显著程度
差异非常显著
t & t(df)0.05P & 0.05差异不显著
  5、根据是以上分析,结合具体情况,作出结论。
  例如,T检验可用于比较药物治疗组与安慰剂治疗组病人的测量差别。理论上,即使样本量很小时,也可以进行T检验。(如样本量为10,一些学者声称甚至更小的样本也行),只要每组中变量呈正态分布,两组方差不会明显不同。如上所述,可以通过观察数据的分布或进行正态性检验估计数据的正态假设。方差齐性的假设可进行F检验,或进行更有效的Levene's检验。如果不满足这些条件,只好使用非参数检验代替T检验进行两组间均值的比较。
  T检验中的P值是接受两均值存在差异这个假设可能犯错的概率。在上,当两组观察对象总体中的确不存在差别时,这个概率与我们拒绝了该假设有关。一些学者认为如果差异具有特定的方向性,我们只要考虑单侧,将所得到t-检验的P值分为两半。另一些学者则认为无论何种情况下都要报告标准的双侧T检验概率。
  1、数据的排列
  为了进行独立样本T检验,需要一个自(分组)变量(如性别:男女)与一个因变量(如测量值)。根据自变量的特定值,比较各组中因变量的均值。用T检验比较下列男、女儿童身高的均值。
对象1对象2对象3对象4对象5男性男性男性女性女性111110109102104
男性身高均数 = 110女性身高均数 = 103
  2、T检验图
  在T检验中用箱式图可以直观地看出均值与的比较,见下图:
  这些图示能够很快地估计并且直观地表现出分组变量与因变量关联的强度。
  3、多组间的比较
  科研实践中,经常需要进行两组以上比较,或含有多个自变量并控制各个自变量单独效应后的各组间的比较,(如性别、药物类型与剂量),此时,需要用方差分析进行,方差分析被认为是T检验的推广。在较为复杂的设计时,方差分析具有许多t-检验所不具备的优点。(进行多次的T检验进行比较设计中不同格子均值时)。
要有严密的抽样设计随机、均衡、可比
选用的检验方法必须符合其适用条件(注意:t检验的前提是资料服从正态分布)
单侧检验和双侧检验
  单侧检验的界值小于双侧检验的界值,因此更容易拒绝,犯第Ⅰ错误的可能性大。
的结论不能绝对化
不能拒绝H0,有可能是样本数量不够拒绝H0 ,有可能犯第Ⅰ类错误
正确理解P值与差别有无统计学意义
  P越小,不是说明实际差别越大,而是说越有理由拒绝H0 ,越有理由说明两者有差异,差别有无统计学意义和有无专业上的实际意义并不完全相同
和可信区间的关系
结论具有一致性
差异:提供的信息不同
  区间估计给出总体均值可能取值范围,但不给出确切的概率值,可以给出H0成立与否的概率
宇传华.医疗等本科班《医学统计学》第三章 两组资料均数的比较2
李克东编著.第十三章 SPSS的应用 教育技术学主干课程系列教材 教育技术学研究方法.北京师范大学出版社,2003年04月第1版.
本条目对我有帮助420
&&如果您认为本条目还有待完善,需要补充新内容或修改错误内容,请。
本条目相关文档
& 8页& 25页& 114页& 16页& 72页& 3页& 18页& 17页& 44页& 40页
本条目由以下用户参与贡献
,,,,,,,,,,.
(window.slotbydup=window.slotbydup || []).push({
id: '224685',
container: s,
size: '728,90',
display: 'inlay-fix'
评论(共65条)提示:评论内容为网友针对条目"T检验"展开的讨论,与本站观点立场无关。
发表评论请文明上网,理性发言并遵守有关规定。
以上内容根据网友推荐自动排序生成

我要回帖

更多关于 t检验 双样本方差假设 的文章

 

随机推荐