x1和x2对y无影响.应采用什么假设检验中的两类错误

请选择栏目:
当前位置: &&&&&& > 正文
第六节 x2检验
 来源:&&   |
&&& x2检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法。可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类。
&&& 一、四格表资料的x2检验
&&& 例20.7某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者,结果如表20-11,问两种疗法有无差别?
表20-11 两种疗法治疗卵巢癌的疗效比较
有效率(%) 
化疗加放疗组 
&&& 表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为:
&&& 式中A为实际数,以上四格表的四个数据就是实际数。T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。兹以表20-11资料为例检验如下。
&&& 检验步骤:
&&& 1.建立检验假设:
&&& H0:π1=π2
&&& H1:π1≠π2
&&& α=0.05
&&& 2.计算理论数(TRC),计算公式为:
&&& TRC=nR.nc/n 公式(20.13)
&&& 式中TRC是表示第R行C列格子的理论数,nR为理论数同行的合计数,nC为与理论数同列的合计数,n为总例数。
&&& 第1行1列: 43×53/87=26.2
&&& 第1行2列: 43×34/87=16.8
&&& 第2行1列: 44×53/87=26.8
&&& 第2行2列: 4×34/87=17.2
&&& 以推算结果,可与原四项实际数并列成表20-12:
表20-12 两种疗法治疗卵巢癌的疗效比较
19(26.2) 
24(16.8) 
化疗加放疗组 
34(26.8) 
10(17.2) 
&&& 因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1.1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:
&&& T1.1=26.2
&&& T1.2=43-26.2=16.8
&&& T2.1=53-26.2=26.8
&&& T2.2=44-26.2=17.2
&&& 3.计算x2值 按公式20.12代入
&&& 4.查x2值表求P值
&&& 在查表之前应知本题自由度。按x2检验的自由度v=(行数-1)(列数-1),则该题的自由度v=(2-1)(2-1)=1,查x2界值表(附表20-1),找到x20.001(1)=6.63,而本题x2=10.01即x2>x20.001(1),P<0.01,差异有高度统计学意义,按α=0.05水准,拒绝H0,可以认为采用化疗加放疗治疗卵巢癌的疗效比单用化疗佳。
&&& 通过实例计算,读者对卡方的基本公式有如下理解:若各理论数与相应实际数相差越小,x2值越小;如两者相同,则x2值必为零,而x2永远为正值。又因为每一对理论数和实际数都加入x2值中,分组越多,即格子数越多,x2值也会越大,因而每考虑x2值大小的意义时同时要考虑到格子数。因此自由度大时,x2的界值也相应增大。
&&& 二、四格表的专用公式
&&& 对于四格表资料,还可用以下专用公式求x2值。
&&& 式中a、b、c、d各代表四格表中四个实际数,现仍以表20-12为例,将上式符号标记如下(表20-13),并示范计算。
表20-13 两种疗法治疗卵巢肿瘤患者的疗效
43(a+b) 
化疗加放疗组 
44(c+d) 
53(a+c) 
34(b+d) 
&&& 计算结果与前述用基本公式一致,相差0.01用换算时小数点后四舍五入所致。
&&& 三、四格表x2值的校正
&&& x2值表是数理统计根据正态分布中的定义计算出来的。&&& 是一种近似,在自由度大于1、理论数皆大于5时,这种近似很好;当自由度为1时,尤其当1<T<5,而n>40时,应用以下校正公式:
&&& 如果用四格表专用公式,亦应用下式校正:
&&& 例20.8某医师用甲、乙两疗法治疗小儿单纯性消化不良,结果如表20-14.试比较两种疗法效果有无差异?
表20-14 两种疗法效果比较的卡方较正计算
26(28.82) 
7(4.18) 
36(33.18) 
2(4.82) 
&&& 从表20-14可见,T1.2和T2.2数值都<5,且总例数大于40,故宜用校正公式(20.15)检验。步骤如下:
&&& 1.检验假设:
&&& H0:π1=π2
&&& H1:π1≠π2
&&& α=0.05
&&& 2.计算理论数:(已完成列入四格表括弧中)
&&& 3.计算x2值:应用公式(20.15)运算如下:
&&& 查x2界值表,x20.05(1)=3.84,故x2<x20.05(1),P>0.05.
&&& 按α=0.05水准,接受H0,两种疗效差异无统计学意义。
&&& 如果不采用校正公式,而用原基本公式,算得的结果x2=4.068,则结论就不同了。
&&& 如果观察资料的T<1或n<40时,四格表资料用上述校正法也不行,可参考预防医学专业用的医学统计学教材中的精确检验法直接计算概率以作判断。
&&& 四、行×列表的卡方检验(x2test for R×C table)
&&& 适用于两个组以上的率或百分比差别的显著性检验。其检验步骤与上述相同,简单计算公式如下:
&&& 式中n为总例数;A为各观察值;nR和nC为与各A值相应的行和列合计的总数。
&&& 例20.9北方冬季日照短而南移,居宅设计如何适应以获得最大日照量,增强居民体质,减少小儿佝偻病,实属重要。胡氏等1986年在北京进行住宅建筑日照的研究,对214幢楼房居民的婴幼儿712人体检,检出轻度佝偻病333例,比较了居室朝向与患病的关系。现将该资料归纳如表20-15作行×列检验。
表20-15居室朝向与室内婴幼儿佝偻病患病率比较
检查结果 
居室朝向 
西、西南 
东、东南 
北、东北、西北 
患病率(%) 
&&& 该表资料由2行4列组成,称2×4表,可用公式(20.17)检验。
&&& (一)检验步骤
&&& 1.检验假设
&&& H0:四类朝向居民婴幼儿佝偻病患病率相同。
&&& H1:四类朝向居民婴幼儿佝偻病患率不同。
&&& α=0.05
&&& 2.计算x2值
&&& 3.确定P值和分析
&&& 本题v=(2-1)(4-3)=3,据此查附表20-1:
&&& x20.01(3)=11.34,本题x2=15.08,x2>x20.01(3),P<0.01,按α=0.05水准,拒绝H0,可以认为居室朝向不同的居民,婴幼儿佝偻病患病率有差异。
&&& (二)行×列表x2检验注意事项
&&& 1.一般认为行×列表中不宜有1/5以上格子的理论数小于5,或有小于1的理论数。当理论数太小可采取下列方法处理:①增加样本含量以增大理论数;②删去上述理论数太小的行和列;③将太小理论数所在行或列与性质相近的邻行邻列中的实际数合并,使重新计算的理论数增大。由于后两法可能会损失信息,损害样本的随机性,不同的合并方式有可能影响推断结论,故不宜作常规方法。另外,不能把不同性质的实际数合并,如研究血型时,不能把不同的血型资料合并。
&&& 2.如检验结果拒绝检验假设,只能认为各总体率或总体构成比之间总的来说有差别,但不能说明它们彼此之间都有差别,或某两者间有差别。
&&& 五、配对计数资料x2检验(x2test of paired comparison of enumeration data)
&&& 在计量资料方面,同一对象实验前后差别或配对资料的比较与两样本均数比较方法有所不同;在计数资料方面亦如此。例如表20-16是28份咽喉涂抹标本,每份按同样条件分别接种在甲、乙两种白喉杆菌培养基中,观察白喉杆菌生长情况,试比较两种培养基的效果。
表20-16 两种白喉杆菌培养基培养结果比较
甲培养基 
乙培养基 
&&& 从表中资料可见有四种结果:(a)甲+乙+,(b)甲+乙-(c)甲-乙+,(d)甲-乙-;如果我们目的是比较两种培养基的培养结果有无差异,则(a)、(d)两种结果是一致的,对差异比较毫无意义,可以不计,我们只考虑结果不同的(b)和(c),看其差异有无意义,可以应用以下简易公式计算:
&&& 检验步骤:
&&& 1.检验假设
&&& H0:π1=π2
&&& H1:π1≠π2
&&& α=0.05
&&& 2.计算x2值
&&& 3.确定P值和分析 配对资料v=1,查附表20-1得知x20.05(1)=3.84,x2>x0.05(1),P<0.05,按α=0.05水准,拒绝H0,可以认为甲培养基的白喉杆菌生长效率较高。
&&& 如果b+c>40,则可采用:
&&& 此外还有两种以上处理方法的比较,可参阅预防医学专业的医学统计方法有关章节。
附表20-1 x2界值表
2017公卫执业/助理医师网络辅导班次介绍
40大类,1000多门辅导课程
助考之星--百万题库软件:
1、凡本网注明“来源:医学教育网”的所有作品,版权均属医学教育网所有,未经本网授权不得转载、链接、转贴或以其他方式使用;已经本网授权的,应在授权范围内使用,且必须注明“来源:医学教育网”。违反上述声明者,本网将追究其法律责任。
2、本网部分资料为网上搜集转载,均尽力标明作者和出处。对于本网刊载作品涉及版权等问题的,请作者与本网站联系,本网站核实确认后会尽快予以处理。
  本网转载之作品,并不意味着认同该作品的观点或真实性。如其他媒体、网站或个人转载使用,请与著作权人联系,并自负法律责任。
3、本网站欢迎积极投稿
4、联系方式:
编辑信箱:
电话:010-
 |  |  | 1、考虑以下过原点回归:;Yt??1Xi1??2Xi2?ei;⑴求参数的OLS估计量⑵对该模型,是否仍有结论;??;?e?0?eX;i1;?0;?eX;i2;?0;解答:;⑴根据最小二乘原理,需求适当的?1、?2,使得残;??;??;min?e???Yi??1Xi1??2Xi2?;??;由微积分知识,对上式分别关于?1、?2求偏导,并;??;???;Y??X
1、 考虑以下过原点回归:
Yt??1Xi1??2Xi2?ei
⑴ 求参数的OLS估计量 ⑵ 对该模型,是否仍有结论
⑴ 根据最小二乘原理,需求适当的?1、?2,使得残差平方和最小:
min?e???Yi??1Xi1??2Xi2?
由微积分知识,对上式分别关于?1、?2求偏导,并令导数值为零,得如下正规方程组:
Y??X??X??i1i12i2?Xi1?0????
??Y??X??X?X?0
?i?1i12i2?i2????
??1?Xi1??2?Xi1Xi2??Xi1Yi
??1?Xi1Xi2??2?Xi22??Xi2Yi?
XY???X????XY???X???
?X?X???XX?XY???X????XY???X???
?X?X???XX?
⑵ 由⑴中的正规方程组知,对该模型,仍有
?e?0,即过原点回归的残差和不一定为零。
2、 下表给出Y关于X1、X2的线性回归结果
(1) 求样本容量n,残差平方和RSS,回归平方和ESS及残差平方和RSS的自由度 (2) 求拟合优度R及调整的拟合优度R
(3) 检验假设:X1和X2对Y无影响。应采用何种假设检验?为什么? (4) 根据以上信息,你能否确定解答:
⑴ 样本容量为
X1和X2各自对Y的影响
RSS?TSS?ESS??77 ESS的自由度为 k?2
RSS的自由度为 n?k?1?12
??0.9988 ⑵R?
TSS4R?1?(1?R2)?1?0.6
⑶ 应该采用联合假设检验,即F检验,理由是只有这样做才能判断X1,X2一起是否对Y有影响
⑷ 不能。因为仅通过上述信息,可初步判断X1,X2联合起来对Y有线性影响,两者的变化解释了Y变化的99.8%。但由于无法知道回归X1,X2前参数的具体估计值,因此还无法判断它们各自对Y的影响有多大。
证明:一元线性回归总离差平方和的分解式中:
?ye??(Y?Y)e??Ye??Ye??Ye?Y?e
4.给定一元线性回归模型:
Yt??0??1Xt??t
(1)叙述模型的基本假定;(2)写出参数
?0和?1的最小二乘估计公式;
(3)说明满足基本假定的最小二乘估计量的统计性质; (4)写出随机扰动项方差的无偏估计公式。
答:(1)零均值,同方差,无自相关,解释变量与随机误差项相互独立(或者解释变量为非随机变量)
????? ,?01
(3)线性性,无偏性,有效性
2?2x2?y,其中?e??y???t??
?1?xtyt 1?t
5.假设调查了100户家庭,其收入(x,百元)与消费(y,百元)资料如下表所示,依据表中资料建立消费y对收入x的线性回归方程,其估计结果如下:
(1)建立消费y对收入x的回归直线 (2)说明回归直线的代表性及解释能力 (3)在95%的置信度下检验参数的显著性
建立的消费y对收入x的回归直线方程为:
Y =2..191513*X
根据我们得到的调整后的拟合优度为0.8984可以说明我们建立的回归直线的代表性和解释能力是比较好的。
根据我们从软件中计算出来的斜率系数的t统计值为8.9767,同时其对应的p值几乎为0,小于5%,所以可以在5%的显著水平下拒绝该参数为0的原假设,认为该解释变量家庭收入对消费是有显著影响的。
6、产生异方差性的原因及异方差性对模型的OLS估计有何影响。
产生原因:(1)模型中遗漏了某些解释变量;(2)模型函数形式的设定误差;(3)样本数据的测量误差;(4)随机因素的影响。 产生的影响:如果线性回归模型的随机误差项存在异方差性,会对模型参数估计、模型检验及模型应用带来重大影响,主要有:(1)不影响模型参数最小二乘估计值的无偏性;(2)参数的最小二乘估计量不是一个有效的估计量;(3)对模型参数估计值的显著性检验失效;(4)模型估计式的代表性降低,预测精度降低。 7.为了解职业妇女是否受到歧视,根据该国统计局的“当前人口调查”中的截面数据进行考察,研究男女工资是否具有差别。这项多元回归分析研究所用到的变量有:
W――雇员的工资率(美元/小时)
Sex----若雇员为女,则为1,其他为0
Age----年龄
Edu-----受教育年数
对200名雇员的样本进行研究,得到如下回归结果:()中为t值
?? =?6.41?2.76??????+0.99??????+0.12??????
求调整后的可决系数。 系数age估计值的标准差是多少?
该国妇女在工资上是否收到歧视?为什么?(在5%的显著水平下) [??0.025 120 =1.9719, ??0.05 120 =1.6525] 答案:(1) =1?(2)
?????=1??????(1???2)=0.864
=?????0=0.12?0=0.026 =0,所以???? ??
因为??0.025 120 =1.,所以拒绝原假设,??2=?2.76,为负值,说明存在妇女
8.关于随机误差项的经典假设条件的内容是什么,为什么要对回归模型规定经典假设条件? 答:
零均值假定
即在给定Xt的条件下,随机误差项ut的数学期望为零。
假设2: 同方差假定
即误差项ut的方差与t无关,为一个常数。
假定3: 无自相关假定
即不同的误差项ut和us相互独立。
假定4: 解释变量xt与随机误差项ut不相关假定。
只有具备这些假设,我们用最小二乘法估计出的估计量才具有良好的性质。
9.美国各航空公司业绩的统计数据公布在《华尔街日报2009年年鉴》(The Wall Street Journal
三亿文库包含各类专业文献、文学作品欣赏、各类资格考试、应用写作文书、行业资料、外语学习资料、幼儿教育、小学教育、专业论文、计量经济考题--横截面数据部分05等内容。 
 试题一一、单项选择题 1 .回归分析中使用的距离是点到直线的垂直坐标距离。最...以横截面数据为样本建立起来的计量经济模型中的随机误差项往往存在 ___。 (异...  经济计量学试题1)_经济学_高等教育_教育专区。习题 1 一. 单项选择题 1.横截面数据是指( A )。 A 同一时点上不同统计单位相同统计指标组成的数据 B 同一...  计量经济学试题1[1]_金融/投资_经管营销_专业资料。计量经济学试题 1 一、单项...以横截面数据为样本建立起来的计量经济模型中的随机误差项往往存在 ___。 (异...  潘省初计量经济学中级教程习题参考答案_从业资格考试_资格考试/认证_教育专区。计量...3.4 (1) 横截面数据. (2) 不能采用 OLS 法进行估计,由于各个县经济实力...  计量经济学试题及答案(2) 一、单项选择题(本大题共 5 小题,每小题 1 分...方差的数据为( ) A.时序数据 B.修匀数据 C.横截面数据 D.年度数据 二、...  云南农业大学计量经济学考题_经济学_高等教育_教育专区。云南农业大学计量经济学...两大研究对象:横截面数 据( Cross-sectional Data )和时间序列数据(Time-...  必做计量经济学期末试题... 9页 1下载券 计量经济学习题及答案 13页 1下载...总量数据 C 平均数据 ⒉横截面数据是指【 A 】 B 横截面数据 D 相对数据 ...  计量经济学试题 1 一、单项选择题 1.回归分析中使用的距离是点到直线的垂直...(经济、统计、计量经济、预测性能) 5.以横截面数据为样本建立起来的计量经济...  全国计量经济学自学考试试题_经济学_高等教育_教育专区。全国 2009 年 10 月高等...数据 B.横截面数据 D.相对数据 ) B.应用研究 D.定性研究 ) ) C 2.经济...求证x1^2+x2^2和y1^2+y2^2为定值【高中数学吧】_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0成为超级会员,使用一键签到本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:224,181贴子:
求证x1^2+x2^2和y1^2+y2^2为定值收藏
点P(x1,y1)和Q(x2,y2)在x^2/3+y^2/2=1上,S三角形OPQ=√6/2,求证x1^2+x2^2和y1^2+y2^2为定值
「100教育」高中数学,专业学科辅导机构,每年辅导数万学员,家长都说效果好.高中数学,试听后报课.
把P、Q设出来的关系式列出来,SOPQ=PQ·D(D:PQ到原点的距离),化简即可。
登录百度帐号推荐应用
为兴趣而生,贴吧更懂你。或导读:上述统计量满足F分布,(2)写出检验H0:?1?2?2?1的t统计量,第三章习题,3、(3-17)假设要求你建立一个计量经济模型来说明在学校跑道上慢跑一英里,答:⑴答案并不唯一,(1)检验模型A中的每一个回归系数在10%水平下是否为零(括号中的值为双边备择p-值)。根据检验结果,你认为应该把变量保留在模型中还是去掉?(2)在模型A中,在10%水平下检验联合假设H0:?i=0(i=1,5,6,7
(1)检验模型A中的每一个回归系数在10%水平下是否为零(括号中的值为双边备择p-值)。根据检验结果,你认为应该把变量保留在模型中还是去掉? (2)在模型A中,在10%水平下检验联合假设H0:?i =0(i=1,5,6,7)。说明被择假设,计
算检验统计值,说明其在零假设条件下的分布,拒绝或接受零假设的标准。说明你的结论。
(3)哪个模型是“最优的”?解释你的选择标准。
(4)说明最优模型中有哪些系数的符号是“错误的”。说明你的预期符号并解释原因。确认
其是否为正确符号。 解答:(1)直接给出了P-值,所以没有必要计算t-统计值以及查t分布表。根据题意,如果p-值&0.10,则我们拒绝参数为零的原假设。
由于表中所有参数的p-值都超过了10%,所以没有系数是显著不为零的。但由此去掉所有解释变量,则会得到非常奇怪的结果。其实正如我们所知道的,多元回去归中在省略变量时一定要谨慎,要有所选择。本例中,value、income、popchang的p-值仅比0.1稍大一点,在略掉unemp、localtax、statetax的模型C中,这些变量的系数都是显著的。
(2)针对联合假设H0:?i =0(i=1,5,6,7)的备择假设为H1:?i =0(i=1,5,6,7)
中至少有一个不为零。检验假设H0,实际上就是参数的约束性检验,非约束模型为模型A,约束模型为模型D,检验统计值为 F?
(5.038e?7?4.763e?7)/(7?3)
(4.763e?7)/(40?8)
显然,在H0假设下,上述统计量满足F分布,在10%的显著性水平下,自由度为(4,32)的F分布的临界值位于2.09和2.14之间。显然,计算的F值小于临界值,我们不能拒绝H0,所以βi(i=1,5,6,7)是联合不显著的。
(3)模型D中的3个解释变量全部通过显著性检验。尽管R2与残差平方和较大,但相对来说其AIC值最低,所以我们选择该模型为最优的模型。
(4)随着收入的增加,我们预期住房需要会随之增加。所以可以预期β3&0,事实上其估计值确是大于零的。同样地,随着人口的增加,住房需求也会随之增加,所以我们预期β4&0,事实其估计值也是如此。随着房屋价格的上升,我们预期对住房的需求人数减少,即我们预期β3估计值的符号为负,回归结果与直觉相符。出乎预料的是,地方税与州税为不显著的。由于税收的增加将使可支配收入降低,所以我们预期住房的需求将下降。虽然模型
A是这种情况,但它们的影响却非常微弱。
4、(例4)在经典线性模型基本假定下,对含有三个自变量的多元回归模型:
Y??0??1X1??2X2??3X3??
你想检验的虚拟假设是H0:?1?2?2?1。
??2??)。 ?,??的方差及其协方差求出Var(?
(1)用?1212
(2)写出检验H0:?1?2?2?1的t统计量。
(3)如果定义?1?2?2??,写出一个涉及?0、?、?2和?3的回归方程,以便能直接得到?估计值??及其标准误。
??2??)?Var(??)?4Cov(??,??)?4Var(??) 解答:(1)由数理统计学知识易知
Var(?121122
(2)由数理统计学知识易知
??2???1?12??2??)se(?12
??2??)为(???2??)的标准差。 ,其中se(?1212
(3)由?1?2?2??知?1???2?2,代入原模型得
Y??0?(??2?2)X1??2X
??0??X1??2(2X1?X2)??3X3??
这就是所需的模型,其中?估计值??及其标准误都能通过对该模型进行估计得到。
1、(3-2)观察下列方程并判断其变量是否呈线性?系数是否呈线性?或都是?或都不是?
1)Yi??0??1Xi??i
2)Yi??0??1logXi??i
3)logYi??0??1logXi??i
4)Yi??0??1(?2Xi)??i 5)Yi?
6)Yi?1??0(1?Xi1)??i
7)Yi??0??1X1i??2X2i??i
3、(3-17)假设要求你建立一个计量经济模型来说明在学校跑道上慢跑一英里
或一英里以上的人数,以便决定是否修建第二条跑道以满足所有的锻炼者。你通过整个
学年收集数据,得到两个可能的解释性方程:
??125.0?15.0X?1.0X?1.5X
R2?0.75 方程A:Y123
方程B:Y??123.0?14.0X1?5.5X2?3.7X4
R2?0.73 其中:Y――某天慢跑者的人数
X1――该天降雨的英寸数
――该天日照的小时数
X3――该天的最高温度(按华氏温度) ――第二天需交学期论文的班级数
请回答下列问题:(1)这两个方程你认为哪个更合理些,为什么?
(2)为什么用相同的数据去估计相同变量的系数得到不同的符号?
答:⑴方程B更合理些。原因是:方程B中的参数估计值的符号与现实更接近些,如与日
照的小时数同向变化,天长则慢跑的人会多些;与第二天需交学期论文的班级数成反向变化,这一点在学校的跑道模型中是一个合理的解释变量。
⑵解释变量的系数表明该变量的单位变化在方程中其他解释变量不变的条件下对被解释变量的影响,在方程A和方程B中由于选择了不同的解释变量,如方程A选择的是“该天的最高温度”而方程B选择的是“第二天需交学期论文的班级数”,由此造成X2与这两个变量之间的关系不同,所以用相同的数据估计相同的变量得到不同的符号。
4、(3-19)假定以校园内食堂每天卖出的盒饭数量作为被解释变量,盒饭价格、气温、附近餐厅的盒饭价格、学校当日的学生数量(单位:千人)作为解释变量,进行
回归分析;假设不管是否有假期,食堂都营业。不幸的是,食堂内的计算机被一次病毒侵犯,所有的存储丢失,无法恢复,你不能说出独立变量分别代表着哪一项!下面是回归结果(括??10.6?28.4X?12.7X?0.61X?5.9X
号内为标准差):Yi1i2i3i4i
要求:(1)试判定每项结果对应着哪一个变量?
(2)对你的判定结论做出说明。
答:⑴答案并不唯一,猜测为:X1为学生数量,X2为附近餐厅的盒饭价格,X3为气温,
X4为校园内食堂的盒饭价格;
⑵理由是被解释变量应与学生数量成正比,并且应该影响显著;与本食堂盒饭价格成反比,这与需求理论相吻合;与附近餐厅的盒饭价格成正比,因为彼此是替代品;与气温的变化关系不是十分显著,因为大多数学生不会因为气温升高不吃饭。
5、(3-21)下表给出三变量模型的回归结果:
方差来源 来自回归来自残差平方和(SS)
65965 _― 自由度(d.f.)
― ― 平方和的均值(MSS)
― ― 要求:(1)样本容量是多少?
(2)求RSS?
(3)ESS和RSS的自由度各是多少? (4)求R2和R?
(5)检验假设:X2和X3对Y无影响。你用什么假设检验?为什么? (6)根据以上信息,你能否确定X2和X3各自对Y的贡献吗? 解:(1)样本容量为
n=14.+1=15
RSS=TSS-ESS==77 (3)ESS的自由度为: d.f.= 2
RSS的自由度为: d.f.=n-2-1=12 (4)R=ESS/TSS==0.9988
R=1-(1- R)(n-1)/(n-k-1)=1-0.=0.9986
(5)应该采用方程显著性检验,即F检验,理由是只有这样才能判断X1、X2一起是否对Y有影响。
(6)不能。因为通过上述信息,仅可初步判断X1、X2联合起来对Y有线性影响,两者的变化解释了Y变化的99.8%。但由于无法知道X1,X2前参数的具体估计值,因此还无法判断它们各自对Y的影响有多大。
6、(3-23)考虑以下方程(括号内为估计标准差):
??8.562?0.364P?0.004P?2.560U Witt?1t
(0.080) (0.072)
其中:W――t年的每位雇员的工资和薪水
――t年的物价水平 ――t年的失业率
要求:(1)对个人收入估计的斜率系数进行假设检验;(尽量在做本题之前不参考结果)
(2)讨论Pt?1在理论上的正确性,对本模型的正确性进行讨论;Pt?1是否应从方程中
包含总结汇报、人文社科、资格考试、办公文档、专业文献、外语学习、行业论文、旅游景点、考试资料、经管营销以及计量经济学平时作业习题及答案等内容。本文共7页
相关内容搜索您所在位置: &
&nbsp&&nbsp&nbsp&&nbsp
03计量第三章多元.ppt53页
本文档一共被下载:
次 ,您可全文免费在线阅读后下载本文档。
文档加载中...广告还剩秒
需要金币:350 &&
你可能关注的文档:
··········
··········
Dependent Variable: Y Method: Least Squares Date: 01/14/05
Time: 17:31 Sample adjusted :
Included observations: 16 after adjusting endpoints Variable Coefficient Std. Error t-Statistic Prob. C 540.53 6..0000 X 0...0 Y -1 0....0011 R-squared 0.999773 Mean dependent var 13618.94 Adjusted R-squared 0.999739 S.D. dependent var 11360.47 S.E. of regression 183.6831 Akaike info criterion 13.43166 Sum squared resid
Schwarz criterion 13.57652 Log likelihood -104.4533 F-statistic 28682.51 Durbin-Watson stat 1.450101 Prob F-statistic 0.000000 例:建立中国消费模型。Y代表消费总额,X代表国内生产总值。Y -1 代表前一年消费总额。 Dependent Variable: Y Method: Least Squares Date: 01/13/05
Time: 20:32 Sample:
Included observations: 12 Variable Coefficient Std. Error t-Statistic Prob. C 6..120 0.8337 X 0....0001 S 0....4214 R-squared 0.998417 Mean dependent var 773.8333 Adjusted R-squared 0.998065 S.D. dependent var 447.6266 S.E. of regression 19.68865 Akaike info criterion 9.010280 Sum squared resid
Schwarz criterion 9.131507 Log likelihood -51.06168 F-statistic
Durbin-Watson stat 1.608149 Prob F-statistic 0.000000 例:根据我国农村居民人均年消费额Y 元 ,人均年纯收入X 元 、年底人均储蓄额S 元 数据,建立线性回归模型。 §3-4 多元线性回归模型的置信区间 线性回归模型的置信区间问题包括两个方面:参数估计量的置信区间和应变量预测值的置信区间。 点估计是用一个样本的具体指标去估计总体的未知参数,优点是能给出一个明确的值,缺点是没有指出这种判断的把握有多大。 区间估计则是估计未知参数所在的可能区间,并能以一定的置信度 概率 来保证估计的正确性,因此区间估计也称为置信区间。 第
正在加载中,请稍后...

我要回帖

更多关于 spss假设检验 的文章

 

随机推荐