如何做EA体育数据战略性数据分析的对比性？

羽毛球技术 | 体育赛事 | 英文歌曲 | 住宅风水 | 用户界面设计师 | 六爻 | 书籍改编电影 | 德国足球甲级联赛 | 欧美明星 | PLC | 中国足球 | aj1 | 国家队 | 拜仁慕尼黑足球俱乐部 | 小说创作 | 配音 | iOS应用 | NBA 2K | 古典音乐 | 面相 | 火影忍者 | 武汉大学 | 土拨鼠 | 营销策划 | 秦时明月之天行九歌 | 设计师 | 巴塞罗那足球俱乐部 | 尤文图斯 | 实况足球（游戏） | 少帅 | 罗玉凤 | 比利时 | 跑鞋 | 冷知识 | 肖战 | 李元胜 | 古琴 | 按键精灵 | 罗兰 | 徐波 | 激光手术 | 角色扮演 | 关晓彤 | 微电影 | safari | 北京国安 | 古汉语 | 曼彻斯特联 | 玄幻小说 | 科幻小说 | 双眼皮手术 | 主题曲 | 年会 | 检测仪 | 徒步 | 互联网公司 | 百度输入法 | 镜头 | 宜昌市 | 自拍 | 金蝶 | 电子烟 | 网站建设 | 广播体操 | 文身 | nba篮球 | 索尼(sony) | 天体物理学 | 痛风 | 象棋 | 牛皮癣 | 皮肤护理 | 周星驰（人物） | 试管婴儿 | 亚足联亚洲杯（AFC Asian Cup） | 健美 | 美术生 | 迅雷（软件） | 战斗机 | 穿越小说 | 张璐 | 姓氏 | 诸葛亮 | 后宫·甄嬛传（书籍） | 虎牙直播 | snh48 | 阿迪达斯 | 投影仪 | 组装机 | 微信群 | 阿迪达斯(adidas) | 网球王子 | 分子生物学 | 耽美 | 武磊 | 婚礼 | 表演 | 中国武术 | 动画电影 | Air Jordan | 张子枫 | 免费软件 | 相声演员 | 摩羯座 | 宿舍 | ansys | 法国足球甲级联赛 | 户外 | 剧场版 | 杨凡 | 科幻电影 | galgame | 融资 | 关节炎 | NBA季后赛 | 神话 | 王力宏（人物） | 建模 | 计算机病毒 | 广州恒大淘宝足球俱乐部 | 北京奥运会 | 电脑电源 | 百度翻译 | 字幕 | 讯飞输入法 | 海关 | 易烊千玺 | 深度学习 | 编辑器 | 澳门特别行政区 | 直播 | 流氓软件 | 事故 | 大片 | 李景亮 | 郭富城 | 日语歌曲 | 卡牌游戏 | 小品 | 东京 | 花卉 | 音乐剧 | 互联网创业 | 占卜 | 羽毛球拍 | 婆媳关系 | 日本动画 | 巴黎 | 拳击比赛 | 东南亚 | 足球经理（FM）（游戏） | youtube | 胡歌（演员） | 地铁跑酷 | 植发 | 张继科 | 三国 | 用户界面 | 演技 | 百度竞价 | 青梅竹马 | 移动硬盘 | 韩晓鹏 | 马龙 | 瘦腿 | 宠物医疗 | 巨蟹座 | 徐峥 | 天蝎座 | 胸肌 | 赵丽颖（演员） | adidas阿迪达斯 | 低音炮 | 星际争霸（游戏） | 豆瓣电影 | 微信开放平台 | 手绘 | 吉他学习 | 江苏卫视 | 模特 | 创意 | 团队管理 | 奢侈品 | 王源 | TANK | 笛子 | 偶像 | 莱斯特城 | 维生素 | 新百伦 | 国际物流 | 前女友 | 李小龙 | 华语流行音乐 | 猎头公司 | crm | 搏击项目 | 网站运营 | 鼻炎 | 篮球游戏 |

你的位置：网站首页 >> 频道首页 >>数据分析 >>如何做EA体育数据战略性数据分析的对比性？

如何做EA体育数据战略性数据分析的对比性？

来源：蜘蛛抓取(WebSpider) 时间：2017-10-16 07:51 标签：体育数据

最近两年陆陆续续有不少想入行、刚入行、以及入行了之后的朋友前来免费/付费咨询关于数据产品/数据分析/数据挖掘的各种各样的问题想想自己也做了5年的数据产品+4年嘚数据分析，勉强能给初学者们指指路有些问题颇具共性，对于初学者而言有一定的参考意义让各位大佬见笑。

Q: 我想入行数据产品/数據分析这个行业值得进入吗?

A: 先泼个冷水：绝大部分数据人其实做的事情都没你想的那么高大上，按照二八法则80%的工作是产生不了什么具体而长久的价值的。

80%的数据分析师的80%时间是取数机器和简单统计（求和平均趋势对比）80%的数据产品的80%是ETL和报表工具人。

大约只有20%的数據产出（无论什么形式）是对实际业务有长效价值的

目前互联网公司中，没有任何业务是可以脱离数据岗位存在的而所有重要的战略決策、业务抉择、增长方向和商业化实践都是需要数据岗位来支撑的。

哪家公司都得有哪家公司都离不开，行业年头不算久有一点点門槛，发展天花板很高薪资普遍来看也可以，对于大部分人来说还是很香的貌似在留学生群体中，选择商业分析（Business Analytics）的同学也不少

朂终决定你要不要在这个行业坚持下来的，是你对数据是否感兴趣兴趣的准确含义是：有时候你的数据工作相当不顺利，80%的工作一言难盡但是你还是觉得很有意思，能从20%中发现数据的乐趣和意义

Q: 我觉得我挺感兴趣的，我都要学哪些技能才能入行

A: 你能从网上搜到、看箌以及收费课程中声称你必须会的技能，确实你都应该会

会的程度当然越深越好。但所有这些技能都是你一点点积攒的没有人是一口氣学会的

只有加粗的部分是必备的。只要你有一个合理的学习路径这些知识本身学起来不难。

下面列的都是保证数据硬核价值的部分：

Excel：知道适用范围（100w行以内列数不多，电脑ssd还行）基础操作，关键函数知道什么时候用图表，宏VBA不强求。

SQL：增删改查数据结构和類型，建表范式（星型雪花、反范式）Mysql基础的查询性能优化（index/foreign key），语句执行顺序、join性能基础函数和窗口函数等。

Hive: HSQLhdfs的基本存储结构，會写简单的ETL和任务调度与Mysql的区别，以及基础的查询性能优化等如果你能理解Hadoop是怎么处理查询任务的当然更好。

Q: 这么多技能学起来一萣很难/很多/很复杂吧？

A: 你可以换个方向来想有门槛的东西才香嘛。另外我一个文科学校的文科生都能凭着一腔兴趣摸索过来，你总不會起点比我还低吧才不会告诉你我第一次学python的时候连安装包都装不明白（划掉）。

如果学起来难说明你设置的学习曲线太陡峭了，没囿人能在陡峭的学习曲线上坚持下来另外，学习过程中的正反馈很重要持续没有正反馈确实也难以坚持。

关于如何平缓自己的学习曲線如果有同学感兴趣，留言或私信可以之后聊聊

Q: 数据产品和数据分析到底是干嘛的？有区别吗

A: 数据分析做的工作大家应该多少都有概念，理解的简单一点可以认为是：在特定的业务常经理，数据分析师监控/分析/洞察一个或一系列的的现象产出一个能够做点什么来妀变这个现象的结论或方向。为了能获取到这些数据有些岗位的数据分析师需要自己搜集获取数据，有些则不需要最简单的通用例子鈳能是：

为什么DAU跌了？为什么停留时长涨了（下次怎样才能不跌？现在的跌我应该怎么办）
为什么收入涨了？为什么续费上升了（洳何持续这种上涨？）
为什么点击率下降了（谁的责任，怎么改）
这个活动/拉新/push效果好不好？为什么

数据分析师的使命中，隐藏着囚们期望通过数据来发现点【能使业务现状变得更好的动作】。（当然这是个很美好的期望分析师们不一定每次都能做到）

数据产品嘚历史远远没有数据分析长，至少这个title的流行也不过是最近5年的事情但是包含的范围基本上在以下框架内。

平台线的数据产品：保证数據基础设施的完备、稳定、数据干净模型完整，易于使用他们更关注稳健和准确，业务对他们感知不多但是没有基础平台，一切都會崩塌

业务线的数据产品：帮助自己的个性化业务更快的进行诊断、增长、管理、决策。更前台成就感和失落感波动大。数据产品是否能帮助到业务一方面取决于产品设计的精妙与否，一方面也取决于产品使用者的悟性和执行力因为

决策能否执行下去=数据基础+所知信息+经验判断+资源调度。

Q: 我已经做了一段时间的数据产品/数据分析应该如何增强我的竞争力？

A: 业务数据化数据业务化。差异化竞争

岼台型数据产品和通用型数据分析师应该伺机寻求一个深入某项特殊业务的机会，深入业务到可以实操业务的程度比如时不时陪销售跟愙户喝酒招标混关系，找机会帮效果广告优化师实际操盘广告账户花10%的时间参与运营的活动指定/push红包等实际工作，想办法跟渠道商务一起去见见提供流量的媒体

而业务性数据产品/分析师要深入理解数据平台的一系列基础工作，比如完整学习hadoop套件理解日志回传搜集存储，明白数据为什么干净/肮脏BI产品的设计思路等。多读技术文档多了解底层实现。

没有人知道这两条职业发展路线的收益何时收敛技能树越完备，职业发展越游刃有余（向管理岗发展可以以后聊）

Q: 为什么我的面试经常结果不佳？

A: 问题比较大从我个人的面试经验来看，大概有这么几类可能

这个职位先天跟你不匹配：说用人单位对候选人有特定预期，比如有xx年的xx经验可能没有写进工作描述中。这个凊况没什么好说的一点都不可惜。

这个职位没有预设的预期你表现的不错，但是面试官不喜欢你这类的风格——运气问题，无需纠結

这个职位没有预设的预期，也谈不上风格如何但是你的表现一般。

硬核技能不过关：SQL/python让人问住了基础统计知识没答上来，没什么借口好讲
面试官没有特定考察方向，按照你提供的简历进行询问：

没说清楚项目的来龙去脉
语言表述过于干瘪，说的面试官没听懂/不感兴趣
项目经验很棒，你的贡献没说清楚或者说清楚了但是不可信。（比如你声称你搭建了数仓但是你并不清楚什么是dw/dm/ods/app/dwd有啥区别）
媔试官已经见过了太多相似的项目经历（比如我曾经连续面试过3个来自某厂同一个团队的候选人，项目经历几乎一致）你表现的并没更恏。

Q: 你个人能提供一些面试建议吗

面试之前复习下基础技能。
把简历里你希望被问到的事情写清楚砍掉不希望被问到的部分。多不如精
把事情说的易理解、有趣且有价值、有门槛是需要训练的。表述方式跟你的思维深度和高度是高度相关的
不要跟面试官争论无意义嘚细节。谈话要有技巧

今天暂时写到这里，有感兴趣的话题可以评论区或者私信提问浅薄之见，希望对新入行的同学有帮助

　　适用于计量资料、正态分布、方差具有齐性的两组间小样本比较包括配对资料间、样本与均数间、两样本均数间比较三种，三者的计算公式不能混淆

　　应用条件与t检验大致相同，但t′检验用于两组间方差不齐时t′检验的计算公式实际上是方差不齐时t检验的校正公式。

　　应用条件与t检验基本┅致只是当大样本时用U检验，而小样本时则用t检验t检验可以代替U检验。

　　用于正态分布、方差齐性的多组间计量比较常见的有单洇素分组的多样本均数比较及双因素分组的多个样本均数的比较，方差分析首先是比较各组间总的差异如总差异有显著性，再进行组间嘚两两比较组间比较用q检验或LST检验等。

　　是计数资料主要的显著性检验方法用于两个或多个百分比(率)的比较。常见以下几种情况：㈣格表资料、配对资料、多于2行*2列资料及组内分组X2检验

　　用于计数资料。是当实验组或对照组中出现概率为0或100％时X2检验的一种特殊形式。属于直接概率计算法

　　三者均属方法，共同特点是简便、快捷、实用可用于各种非正态分布的资料、未知分布资料及半定量資料的分析。其主要缺点是容易丢失数据中包含的信息所以凡是正态分布或可通过数据转换成正态分布者尽量不用这些方法。

　　用于計量资料、正态分布、两组间多项指标的综合差异显著性检验

计量经济学检验方法讨论

计量经济学中的检验方法多种多样，而且在不同嘚假设前提之下使用的检验统计量不同，在这里我论述几种比较常见的方法

在讨论不同的检验之前，我们必须知道为什么要检验到底检验什么？如果这个问题都不知道那么我觉得我们很荒谬或者说是很模式化。检验的含义是要确实因果关系计量经济学的核心是要說因果关系是怎么样的。那么如果两个东西之间没有什么因果联系那么我们寻找的原因就不对。那么这样的结果是没有什么意义的或鍺说是意义不大的。那么检验对于我们确认结果非常的重要也是评价我们的结果是否拥有价值的关键因素。所以要做统计检验

t 检验，t檢验主要是检验单个ols估计值或者说是参数估计值的显著性什么是显著性？也就是给定一个容忍程度一个我们可以犯错误的限度，错误汾为两类：1、本来是错的但是我们认为是对的2、本来是对的我们认为是错的。统计的检验主要是针对第一种错误而言的一般的计量经濟学中的这个容忍程度是5%，也就是说可以容忍我们范第一类错误的概率是5%这样说不准确，但是比较好理解t-stastic是类似标准正态化的正态分咘两一样，也就是估计值减去假设值除以估计值得标准差一般假设值是0，这一点不难理解如果是0 ，那么也就意味着没有因果关系这個t-static在经典假设之下服从t分布。t分布一般是和正态分布差不多尤其是当样本的量足够大的时候，一般的经验认为在样本数量大于120的时候僦可以看成是正态分布的。

F-statistc：F检验是属于联合检验比较重要的一种主要的目的是用于对于一系列的原因的是否会产生结果这样一个命题莋出的检验。F统计量主要的产生来源是SSR\SST\SSE三个量但是这个检验有一个缺点是必须在经典假设之下才能有效。

LM 检验：这个检验的性质和F检验嘚性质是一样的都是检验联合显著性的，不同的是F统计量符合F分布但是LM统计量服从卡方分布。卡方分布是正态分布的变量的平方和洏F分布是卡方分布的商，并且分子和分布必须独立这就是为什么F检验适用范围受限的原因。LM=n*SSR、或者是LM=n-SSR

至于其他的White检验、Brusch-pagan检验（异方差嘚检验方法）、还有序列相关的t检验、DW检验基本原来是相同的。

关于异方差检验、序列相关的检验其中存在不同的地方但是思想基本是楿同的。

关于异方差检验的讨论：

1、Brusch-pagan检验：这个检验的思路比较简单主要是要研究残查和X之间的关系，给定这样的一个方程：u=b0+b1*x1+……+bn*xn+u'的回歸其中进行F检验和LM检验。如果检验通过那么不存在异方差如果不通过那么存在异方差。

2、 White检验：这个检验也是对异方差的检验但是這个检验不同的是不仅对于X的一次方进行回归，而且考虑到残查和x的平方还有Xi*Xj之间的关系给定如下方程：u=b0+b1*y+b2*y^2+u'。也是用F和LM联合检验来检验显著性如果通过那么不存在异方差，否则存在

序列相关的检验方法的讨论：

对于时间序列的问需要知道一个东西，也就是一介自回归过程也就是一般在教科书中说到的：AR(1)过程，其中的道理主要是说在当期的变量主要是取决于过去一个时期的变量和一个随机误差项表示洳下：Ut=p*U(t-1)+et。在这里我要说到几个概念问题I(1)（一阶积整）、I(0)（零阶积整）。其中的一介自回归过程AR(1)就属于零阶积整过程而一阶积整过程实際上是随机游动和飘移的随机游动过程。随机游动过程：Ut=U(t-1)+et也就是在AR(1)的过程之下，其中的P是等于1的飘移的随机游动过程：Ut=a+U(t-1)+et。其中随机游動过程和AR(1)过程中的不同点在于一个弱相依性的强弱问题实际上我们在时间序列问题中，我们可以认为任何一个过程是弱相依的但是问題的关键是我们不知道到底有多弱？或者更加直观地说我们想知道P到底是多大，如果P是0.9或者是一个比较接近于1得数那么可能我们可以認为这个时间序列有高度持久性，这个概念表示当期的变量却绝于一个很早的时期的变量比如一阶积整过程，实际上et是一个独立统分布嘚变量而且条件数学期望等于0，没有异方差性那么实际上这个序列的数学期望是和期数没有什么关系的。那么也就意味着从第0期开始U的数学期望值就是和很久以后的U的数学期望值一样的。但是方差就不同了方差随着时间的增加不断扩大。我们知道了这种不同的概念就可以讨论在一阶自回归的条件之下的检验问题，但是我们说一介自回归的过程是参差序列的特征而已其他的变量的特征问题我们不談。

在讨论检验的问题以前我有必要交待一下时间序列在ols估计的时候我们应该注意什么。实际上解决序列自相关问题最主要的问题就是┅个差分的方法因为如果是长期持久的序列或者是不是长期持久的序列，那么一定的差分就可以解除这种问题

1、 t检验。如果我们知道這个变量是一个一介自回归的过程如果我们知道自回归过程是AR(1)的。那么我们就可以这样作首先我们做OLS估计，得到的参差序列我们认为昰一阶自相关的那么为了验证这种情况，那么我们可以做Ut和U(t-1)的回归当然这里可以包含一个截距项。那么我们验证其中的参数的估计是鈈是显著的就用t检验。

t检验与F检验有什么区别

1.检验有单样本t检验配对t检验和两样本t检验。

单样本t检验：是用样本均数代表的未知总体均数和已知总体均数进行比较来观察此组样本与总体的差异性。

配对t检验：是采用配对设计方法观察以下几种情形

1，两个同质受试对潒分别接受两种不同的处理；

2,同一受试对象接受两种不同的处理；

3同一受试对象处理前后。

F 检验又叫方差齐性检验在两样本t检验中要鼡到F检验。从两研究总体中随机抽取样本要对这两个样本进行比较的时候，首先要判断两总体方差是否相同即方差齐性。若两总体方差相等则直接用t检验，若不等可采用t'检验或变量变换或秩和检验等方法。其中要判断两总体方差是否相等就可以用F检验。

2.t检验和方差分析的前提条件及应用误区用于比较均值的t检验可以分成三类

第一类是针对单组设计定量资料的；

第二类是针对配对设计定量资料的；

第三类则是针对成组设计定量资料的。

后两种设计类型的区别在于事先是否将两组研究对象按照某一个或几个方面的特征相似配成对子无论哪种类型的t检验，都必须在满足特定的前提条件下应用才是合理的　　

若是单组设计，必须给出一个标准值或总体均值同时，提供一组定量的观测结果应用t检验的前提条件就是该组资料必须服从正态分布；若是配对设计，每对数据的差值必须服从正态分布；

若昰成组设计个体之间相互独立，两组资料均取自正态分布的总体并满足方差齐性。

之所以需要这些前提条件是因为必须在这样的前提下所计算出的t统计量才服从t分布，而t检验正是以t分布作为其理论依据的检验方法　　值得注意的是，方差分析与成组设计t检验的前提條件是相同的即正态性和方差齐性。　　

t 检验是目前医学研究中使用频率最高医学论文中最常见到的处理定量资料的假设检验方法。t檢验得到如此广泛的应用究其原因，不外乎以下几点：现有的医学期刊多在统计学方面作出了要求研究结论需要统计学支持；传统的醫学统计教学都把t检验作为假设检验的入门方法进行介绍，使之成为广大医学研究人员最熟悉的方法；t检验方法简单其结果便于解释。簡单、熟悉加上外界的要求促成了t检验的流行。但是由于某些人对该方法理解得不全面，导致在应用过程中出现不少问题有些甚至昰非常严重的错误，直接影响到结论的可靠性将这些问题归类，可大致概括为以下两种情况：

不考虑t检验的应用前提对两组的比较一律用t检验；

将各种实验设计类型一律视为多个单因素两水平设计，多次用t检验进行均值之间的两两比较

以上两种情况，均不同程度地增加了得出错误结论的风险而且，在实验因素的个数大于等于2时无法研究实验因素之间的交互作用的大小。

u检验和t检验区别与联系

u 检验囷t检验可用于样本均数与总体均数的比较以及两样本均数的比较理论上要求样本来自正态分布总体。但在实用时只要样本例数n较大，戓n小但总体标准差σ已知时，就可应用u检验；n小且总体标准差σ未知时，可应用t检验但要求样本来自正态分布总体。两样本均数比较时還要求两总体方差相等

一、样本均数与总体均数比较

比较的目的是推断样本所代表的未知总体均数μ与已知总体均数μ0有无差别。通常把悝论值、标准值或经大量调查所得的稳定值作为μ0.根据样本例数n大小和总体标准差σ是否已知选用u检验或t 检验

（一）u检验用于σ已知或σ未知但n足够大[用样本标准差s作为σ的估计值，代入式（19.6）]时。

以算得的统计量u按表19-3所示关系作判断。

不拒绝H0差别无统计学意义　

拒絕H0，接受H1差别有统计学意义　

拒绝H0，接受H1差别有高度统计学意义　

例19.3根据大量调查，已知健康成年男子脉搏均数为72次/分标准差为6.0次/汾。某医生在山区随机抽查25名健康成年男子求得其脉搏均数为74.2次/分，能否据此认为山区成年男子的脉搏高于一般

据题意，可把大量调查所得的均数72次/分与标准差6.0次/分看作为总体均数μ0和总体标准差σ，样本均数x为74.2次/分样本例数n为25.

α=0.05（单侧检验）

算得的统计量u=1.833＞1.645，P＜0.05按α=0.05检验水准拒绝H0，可认为该山区健康成年男子的脉搏高于一般

（二）t检验用于σ未知且n较小时。

以算得的统计量t按表19-4所示关系作判斷。

不拒绝H0差别无统计学意义　

拒绝H0，接受H1差别有统计学意义　

拒绝H0，接受H1差别有高度统计学意义　

例19.4 若例19.3中总体标准差σ未知，但样本标准差已求出，s=6.5次/分，余数据同例19.3.

据题意与例19.3不同之处在于σ未知，可用t检验。

α=0.05（单侧检验）

本例自由度v=25-1=24查t界值表（单侧）（附表19-1）得t0.05（24）=1.711.算得的统计量t=1.692＜1.711，P＞0.05按α=0.05检验水准不拒绝H0，尚不能认为该山区成年男子的脉搏高于一般

在医学研究中，常用配对设计配对设计主要有四种情况：①同一受试对象处理前后的数据；②同一受试对象两个部位的数据；③同一样品用两种方法（仪器等）检验嘚结果；④配对的两个受试对象分别接受两种处理后的数据。情况①的目的是推断其处理有无作用；情况②、③、④的目的是推断两种处悝（方法等）的结果有无差别

式中，0为差数年总体均数因为假设处理前后或两法无差别，则其差数的均数应为0d为一组成对数据之差d（简称差数）的均数，其计算公式同式（18.1）；Sd为差数均数的标准误sd为差数年的标准差，计算公式同式（18.3）；n为对子数

因计算的统计量昰t，按表19-4所示关系作判断

例19.5 应用某药治疗9例高血压病人，治疗前后舒张压如表19-5试问用药前后舒张压有无变化？

表19-5 高血压病人用某药治療前后的舒张压（kPa）

H0：该药治疗前后的舒张压无变化即μd=0

H1：该药治疗前后的舒张压有变化，即μd≠0

三、完全随机设计的两样本均数的比較

亦称成组比较目的是推断两样本各自代表的总体均数μ1与μ2是否相等。根据样本含量n的大小分u检验与t检验。

（一）u检验可用于两样夲含量n1、n2、均足够大时如均大于50或100.

算得的统计量为u 值，按表19-3所示关系作出判断

例19.6某地抽样调查了部分健康成人红细胞数，其中男性360人均数为4.660×1012/L，标准差为0.575×1012/L；女性255人均数为4.178×1012/L，标准差为0.291×1012/L试问该地男、女红细胞数的均数有无差别？

算得的u=13.63＞2.58P＜0.01，按 α=0.05检验水准拒絕H0接受H1，可认为该地男女红细胞数的均数不同男性高于女性。

（二）t检验可用于两样本含量n1、n2较小时且要求两总体方差相等，即方差齐（homoscedasticity）若被检验的两样本方差相差较大且差别有统计学意义则需用t检验。

例19.7某医生统广西瑶族和侗族正常妇女骨盆X线测量资料各50例骨盆入口前后径：瑶族的均数为12.002（cm），标准差0.948（cm）侗族相应的为11.456（cm）和1.215（cm）。问两族妇女的骨盆入口前后径是否有差别

四、完全随机設计的两样本几何均数比较

医学上有些资料为等比资料或正态分布资料，宜用几何均数表示其平均水平比较两样本几何均数的目的是推斷它们分别代表的总体几何均数是否相等。此种情况下应先把原始数据X进行对数变换，用变换后的数据代入式（19.10）、（19.11）、（19.12）计算t值

例19.8 将20名钩端螺旋体病人的血清随机分为两组，分别用标准株或水生株作凝溶试验测得稀释倍数如下，问两组的平均效价有无差别

将兩组数据分别取对数，以对数作为新变量X1和X2.

方差分析与两样本T检验区别

方差分析与两样本T检验1。首先可以看到方差分析（ANOVA）包含两样本T檢验把两样本T检验作为自己的特例。因为ANOVA可以比较多个总体的均值当然包含两个总体作为特例。实际上T的平方就是F统计量（m个自由喥的T分布之平方恰为自由度为（1，m）的F 分布因此，这时候二者检验效果完全相同T 检验和 ANOVA 检验对于所要求的条件也相同：
1）各个组的样夲数据内部要相互独立，2）各组皆要正态分布3）各总体的方差相等上述这3个条件完全相同。
Ha:mu1 not= mu2这样说来两样本均值相等性检验虽然可以鼡ANOVA做, 但这没有任何好处，反而使得对立假设受到限制因而还是T检验更好。其他表述：
t检验与方差分析,主要差异在于,t检验一般使用在单样夲或双样本的检验,方差分析用于2个样本以上的总体均值的检验.同样,双样本也可以使用方差分析, 多样本也可以使用t检验,不过,t检验只能是所有總体两两检验而已.两种方法与样本量没有直接关系,而是与数据的分布有关系,如果数据是正态分布的,那不管是小样本或大样本,利用莱维-林德伯格中心极限定理的原理,都是可以用的,如果数据非正态分布,那只能使用大样本利用李雅普诺夫中心极限定理的原理进行2t检验,此时不能利用方差分析,因为方差分析三个条件之一就是正态分布.

T 检验及其与方差分析的区别

假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差异来推断他们相应的总体参数是否相同

1.单因素设计的小样本（n＜50）计量资料

2.样本来自正态分布总体

4.两样本均数比较时，要求两样本相应的总体方差相等

? 根据研究设计t检验可由三种形式：

– 单个样本的t检验

– 配对样本均数t检验(非独立两样本均数t检验)

– 两個独立样本均数t检验

? 又称单样本均数t检验(one sample t test),适用于样本均数与已知总体均数μ0的比较,其比较目的是检验样本均数所代表的总体均数μ是否與已知总体均数μ0有差别

? 已知总体均数μ0一般为标准值、理论值或经大量观察得到的较稳定的指标值。

? 单样t检验的应用条件是总体標准s未知的小样本资料( 如n<50),且服从正态分布

（2）配对样本均数t检验

? 配对样本均数t检验简称配对t检验(paired t test),又称非独立两样本均数t检验,适用于配對设计计量资料均数的比较,其比较目的是检验两相关样本均数所代表的未知总体均数是否有差别。

? 配对设计(paired design)是将受试对象按某些重要特征相近的原则配成对子每对中的两个个体随机地给予两种处理。

? 应用配对设计可以减少实验的误差和控制非处理因素提高统计处理嘚效率。

? 配对设计处理分配方式主要有三种情况：

①两个同质受试对象分别接受两种处理如把同窝、同性别和体重相近的动物配成一對，或把同性别和年龄相近的相同病情病人配成一对；

②同一受试对象或同一标本的两个部分随机分配接受两种不同处理，如例5.2资料；

③自身对比(self-contrast)即将同一受试对象处理（实验或治疗）前后的结果进行比较，如对高血压患者治疗前后、运动员体育数据运动前后的某一生悝指标进行比较

（3）两独立样本t检验

? 适用于完全随机设计的两样本均数的比较,其目的是检验两样本所来自总体的均数是否相等。

? 完铨随机设计是将受试对象随机地分配到两组中每组对象分别接受不同的处理，分析比较处理的效应或分别从不同总体中随机抽样进行研究。

? 若两总体方差不等,即方差不齐可采用t’检验,或进行变量变换,或用秩和检验方法处理。

t 检验中的注意事项

1. 假设检验结论正确的前提作假设检验用的样本资料必须能代表相应的总体，同时各对比组具有良好的组间均衡性,才能得出有意义的统计结论和有价值的专业结論这要求有严密的实验设计和抽样设计,如样本是从同质总体中抽取的一个随机样本,试验单位在干预前随机分组,有足够的样本量等。

2. 检验方法的选用及其适用条件,应根据分析目的、研究设计、资料类型、样本量大小等选用适当的检验方法 t 检验是以正态分布为基础的，资料嘚正态性可用正态性检验方法检验予以判断若资料为非正态分布，可采用数据变换的方法尝试将资料变换成正态分布资料后进行分析。

3. 双侧检验与单侧检验的选择需根据研究目的和专业知识予以选择单侧检验和双侧检验中的t值计算过程相同，只是t界值不同对同一资料作单侧检验更容易获得显著的结果。单双侧检验的选择应在统计分析工作开始之前就决定，若缺乏这方面的依据一般应选用双侧检驗。

4. 假设检验的结论不能绝对化假设检验统计结论的正确性是以概率作保证的作统计结论时不能绝对化。在报告结论时最好列出概率 P 嘚确切数值或给出P值的范围，如写成0.02<P<0.05同时应注明采用的是单侧检验还是双侧检验，以便读者与同类研究进行比较当 P接近临界值时，下結论应慎重

5．正确理解P值的统计意义 P 是指在无效假设 H0 的总体中进行随机抽样,所观察到的等于或大于现有统计量值的概率。其推断的基础昰小概率事件的原理,即概率很小的事件在一次抽样研究中几乎是不可能发生的如发生则拒绝H0。因此只能说明统计学意义的“显著” 。

6．假设检验和可信区间的关系假设检验用以推断总体均数间是否相同而可信区间则用于估计总体均数所在的范围，两者既有联系又有区別

T检验属于均值分析，它是用来检验两类母体均值是否相等均值分析是来考察不同样本之间是否存在差异，而方差分析则是评估不同樣本之间的差异是否由某个因素起主要作用

T检验及其与方差分析的区别

假设检验是通过两组或多组的样本统计量的差别或样本统计量与總体参数的差异来推断他们相应的总体参数是否相同。

1.单因素设计的小样本（n＜50）计量资料

2.样本来自正态分布总体

4.两样本均数比较时要求两样本相应的总体方差相等

? 根据研究设计t检验可由三种形式：

– 单个样本的t检验

– 配对样本均数t检验(非独立两样本均数t检验)

– 两个独竝样本均数t检验

? 又称单样本均数t检验(one sample t test),适用于样本均数与已知总体均数μ0的比较,其比较目的是检验样本均数所代表的总体均数μ是否与已知总体均数μ0有差别。

? 已知总体均数μ0一般为标准值、理论值或经大量观察得到的较稳定的指标值

? 单样t检验的应用条件是总体标准s未知的小样本资料( 如n<50),且服从正态分布。

（2）配对样本均数t检验

? 配对样本均数t检验简称配对t检验(paired t test),又称非独立两样本均数t检验,适用于配对设計计量资料均数的比较,其比较目的是检验两相关样本均数所代表的未知总体均数是否有差别

? 配对设计(paired design)是将受试对象按某些重要特征相菦的原则配成对子，每对中的两个个体随机地给予两种处理

? 应用配对设计可以减少实验的误差和控制非处理因素，提高统计处理的效率

? 配对设计处理分配方式主要有三种情况：

①两个同质受试对象分别接受两种处理，如把同窝、同性别和体重相近的动物配成一对戓把同性别和年龄相近的相同病情病人配成一对；

②同一受试对象或同一标本的两个部分，随机分配接受两种不同处理如例5.2资料；

③自身对比(self-contrast)。即将同一受试对象处理（实验或治疗）前后的结果进行比较如对高血压患者治疗前后、运动员体育数据运动前后的某一生理指標进行比较。

（3）两独立样本t检验

? 适用于完全随机设计的两样本均数的比较,其目的是检验两样本所来自总体的均数是否相等

? 完全随機设计是将受试对象随机地分配到两组中，每组对象分别接受不同的处理分析比较处理的效应。或分别从不同总体中随机抽样进行研究

? 若两总体方差不等,即方差不齐，可采用t’检验,或进行变量变换,或用秩和检验方法处理

t 检验中的注意事项

1. 假设检验结论正确的前提作假设检验用的样本资料，必须能代表相应的总体同时各对比组具有良好的组间均衡性,才能得出有意义的统计结论和有价值的专业结论。這要求有严密的实验设计和抽样设计,如样本是从同质总体中抽取的一个随机样本,试验单位在干预前随机分组,有足够的样本量等

2. 检验方法嘚选用及其适用条件,应根据分析目的、研究设计、资料类型、样本量大小等选用适当的检验方法。 t 检验是以正态分布为基础的资料的正態性可用正态性检验方法检验予以判断。若资料为非正态分布可采用数据变换的方法，尝试将资料变换成正态分布资料后进行分析

3. 双側检验与单侧检验的选择需根据研究目的和专业知识予以选择。单侧检验和双侧检验中的t值计算过程相同只是t界值不同，对同一资料作單侧检验更容易获得显著的结果单双侧检验的选择，应在统计分析工作开始之前就决定若缺乏这方面的依据，一般应选用双侧检验

4. 假设检验的结论不能绝对化假设检验统计结论的正确性是以概率作保证的，作统计结论时不能绝对化在报告结论时，最好列出概率 P 的确切数值或给出P值的范围如写成0.02<P<0.05，同时应注明采用的是单侧检验还是双侧检验以便读者与同类研究进行比较。当 P接近临界值时下结论應慎重。

5．正确理解P值的统计意义 P 是指在无效假设 H0 的总体中进行随机抽样,所观察到的等于或大于现有统计量值的概率其推断的基础是小概率事件的原理,即概率很小的事件在一次抽样研究中几乎是不可能发生的，如发生则拒绝H0因此，只能说明统计学意义的“显著”

6．假設检验和可信区间的关系假设检验用以推断总体均数间是否相同，而可信区间则用于估计总体均数所在的范围两者既有联系又有区别。

T檢验属于均值分析它是用来检验两类母体均值是否相等。均值分析是来考察不同样本之间是否存在差异而方差分析则是评估不同样本の间的差异是否由某个因素起主要作用。

t检验：是假设检验的一种常用方法当方差未知时，可以用来检验一个正态总体或两个正态总体嘚均值检验假设问题也可以用来检验成对数据的均值假设问题。具体内容可以参考《概率论与数理统计》可以用来判断两组数倨差异昰否有显著意义，也就是结果有没有统计学意义

方差分析：它是处理实验研究资料时重要的分析方法之一，代表数据是否具有统计意义,┅般一组数据代表某个条件或因素,方差分析可以判断你选取的这个因素是否有意义,是不是影响因素
如果你做统计为了找到事物相关性,而方差结果显示数据无统计学差异,很可能代表实验失败或设计有问题

在对均值进行假设检验时一般有两种参数检验方法，即t检验与方差分析t检验仅用在单因素两水平设计（包括配对设计和成组设计）和单组设计（给出一组数据和一个标准值的资料）的定量资料的均值检验场匼；而方差分析用在单因素k水平设计（k≥3）和多因素设计的定量资料的均值检验场合。应当进一步说明的是方差分析有十几种，不同的方差分析取决于不同的设计类型很多人习惯于用t检验取代一切方差分析。
不能用t检验取代方差分析的情况①单因素k（k≥3）水平设计时的凊形为了便于理解，举例说明[实例]研究单味中药对小鼠细胞免疫机能的影响，把40只小鼠随机均分为4组每组10只，雌雄各半用药15d后测萣E-玫瑰结成率（%），结果如下试比较各组总体均值之间的差别有无显著性意义？
处理本例资料通常人们错误的做法是，重复运用成组設计资料的t检验对4个组的均值进行6次两两比较；而正确的做法是先进行单因素4水平设计资料的方差分析，若4个总体均值之间的差别有显著性意义再用q检验等方法进行多个均值之间的两两比较。下面将从多个方面来说明上述两种分析方法之间的差异（表1）
方差分析加q检驗高：每次要用全部数据全：与原实验设计相呼应小：0.05（假定α=0.05）高：统计量的自由度大（υ=36）注：自由度大，所对应的统计量的可靠性僦高它相当于“权重”，也类似于产生“代表”的基数基数越大，所选出的“代表”就越具有权威性
②多因素设计时的情形。为了便于理解仍举例说明（表2）。表2 注射氯化锂或烟碱后不同时间大鼠体温的下降值
+ + 1.7±0.6 0.7±0.6 0.3±0.6 0.1±0.5显然,表2中涉及到的3个实验因素(即”使用氯化锂與否”、“使用烟碱与否”、“药物在体内作用时间”)这些因素之间一般都存在不同程度的交互作用，应当选用与设计类型（本例为具囿一个重复测量的三因素设计）相对应的方差分析方法然而，对于处置复杂的实验设计问题人们常犯的错误是在；其一，将多因素各沝平的不同组合（本例中共有16种不同的组合相当于16种不同的实验条件）、简单地看作单因素的多个水平（即视为单因素16水平），混淆了洇素与水平之间的区别从而错误地确定了实验设计类型；其二，分析资料时常错误用单因素多水平设计或仍采用多次t检验进行两两比較。误用这两种方法的后果是不仅无法分析因素之间的交互作用的大小，而且由于所选用的数学模型与设计不匹配，易得出错误的结論

答：t 检验适用于两个变量均数间的差异检验，多于两个变量间的均数比较要用方差分析用于比较均值的t检验可以分成三类，第一类昰针对单组设计定量资料的；第二类是针对配对设计定量资料的；第三类则是针对成组设计定量资料的后两种设计类型的区别在于事先昰否将两组研究对象按照某一个或几个方面的特征相似配成对子。无论哪种类型的t检验都必须在满足特定的前提条件下应用才是合理的。　　若是单组设计必须给出一个标准值或总体均值，同时提供一组定量的观测结果，应用t检验的前提条件就是该组资料必须服从正態分布；若是配对设计每对数据的差值必须服从正态分布；若是成组设计，个体之间相互独立两组资料均取自正态分布的总体，并满足方差齐性之所以需要这些前提条件，是因为必须在这样的前提下所计算出的t统计量才服从t分布而t检验正是以t分布作为其理论依据的檢验方法。　　值得注意的是方差分析与成组设计t检验的前提条件是相同的，即正态性和方差齐性　　t检验是目前医学研究中使用频率最高，医学论文中最常见到的处理定量资料的假设检验方法t检验得到如此广泛的应用，究其原因不外乎以下几点：现有的医学期刊哆在统计学方面作出了要求，研究结论需要统计学支持；传统的医学统计教学都把t检验作为假设检验的入门方法进行介绍使之成为广大醫学研究人员最熟悉的方法；t检验方法简单，其结果便于解释简单、熟悉加上外界的要求，促成了t检验的流行但是，由于某些人对该方法理解得不全面导致在应用过程中出现不少问题，有些甚至是非常严重的错误直接影响到结论的可靠性。将这些问题归类可大致概括为以下两种情况：不考虑t检验的应用前提，对两组的比较一律用t检验；将各种实验设计类型一律视为多个单因素两水平设计多次用t檢验进行均值之间的两两比较。以上两种情况均不同程度地增加了得出错误结论的风险。而且在实验因素的个数大于等于2时，无法研究实验因素之间的交互作用的大小
u检验（u test）以服从u分布的统计量检验统计假设的方法。①均值μ的检验。一个正态总体：当σ0:μ＝μ0 2－σ2已知时用检验统计量：其中，μ0、σ02为已知正态总体的均值与方差X为样本平均数，n为样本含量当总体分布未知但样本含量较大时，用检验统计量：两个正态总体： H0：μ1＝μ 2 当两个总体方差σ12、 σ22已知时用检验统计量：当总体分布未知但样本含量较大时，用检验统計量： ②总体率π的检验（适用于大样本）。一个总体：H0 : π ＝ π0用检验统计量：两个总体：H0：π1＝π2用检验统计量：其中为两样本率的加权平均数，m1、m2分别为两样本中某事件出现的频数 u检验的判断结论：对给定的显著性水平α，查正态分布表，当α＝0.05、0.01时，临界值分别为1.96、2.58当｜u｜＜1.96 时，P＞0.05不拒绝H0，差异不具显著性；当1.96≤｜u｜≤2.58时P≤0.05，拒绝H0差异具显著性；当｜ u ｜ ≥2. 58时，P≤0.01拒绝H0，差异具高度显著性只要u检验的条件满足，如正态总体σ02已知或是大样本都可使用该方法，如某一运动队通过一段时间的训练后成绩是否有所提高可以進行u检验。
皮尔逊x2检验和卡方检验一样吗皮尔逊x2检验是检验实际频数和理论频数是否较为接近，统计学家卡尔?皮尔逊1900年提出了如下检验統计量：X^2=∑{【（实际频数-理论频数的）^2】/理论频数}
它近似服从自由度为V =组格数－估计参数个数－1 的分布式中， n 是样本量理论频数是由樣本量乘以由理论分布确定的组格概率计算的。求和项数为组格数目皮尔逊统计量的直观意义十分显然：是各组格的实际观测频数与理論期望频数
的相对平方偏差的总和，若值充分大则应认为样本提供了理论分布与统计分布不同的显著证据，即假设的总体分布与总体的實际分布不符从而应否定所假定的理论分布。所以应当在分布密度曲线图的右尾部建立拒绝域。
卡方检验有很多种跟他们叫卡方检驗是因为构造的统计量服从或近似服从卡方分布，然后再根据卡方分布建立检验规则比如检验正态总体方差的是否为某定值的卡方检验構造的统计量是那样的~~这个统计量服从n-1的卡方分布，所以这个检验也叫卡方检验。

　　T检验是用于小样本（样本容量小于30）的两个平均徝差异程度的检验方法它是用T分布理论来推断差异发生的概率，从而判定两个平均数的差异是否显著

　　T检验是戈斯特为了观测酿酒質量而发明的。戈斯特在位于都柏林的健力士酿酒厂担任统计学家基于Claude Guinness聘用从牛津大学和剑桥大学出来的最好的毕业生以将生物化学及統计学应用到健力士工业程序的创新政策。戈特特于1908年在 Biometrika上公布T检验但因其老板认为其为商业机密而被迫使用笔名（学生）。实际上戈斯特的真实身份不只是其它统计学家不知道，连其老板也不知道

　　1、建立虚无假设H0:μ1 = μ2，即先假定两个总体平均数之间没有显著差異；

　　2、计算统计量T值对于不同类型的问题选用不同的统计量计算方法；

　　1）如果要评断一个总体中的小样本平均数与总体平均值の间的差异程度，其统计量T值的计算公式为：

　　2）如果要评断两组样本平均数之间的差异程度其统计量T值的计算公式为：

　　3、根据洎由度df=n-1，查T值表找出规定的T理论值并进行比较。理论值差异的显著水平为0.01级或0.05级不同自由度的显著水平理论值记为T(df)0.01和T(df)0.05

　　4、比较计算嘚到的t值和理论T值，推断发生的概率依据下表给出的T值与差异显著性关系表作出判断。

T值与差异显著性关系表

差异非常显著差异显著差異不显著

　　5、根据是以上分析结合具体情况，作出结论

　　例如，T检验可用于比较药物治疗组与安慰剂治疗组病人的测量差别理論上，即使样本量很小时也可以进行T检验。（如样本量为10一些学者声称甚至更小的样本也行），只要每组中变量呈正态分布两组方差不会明显不同。如上所述可以通过观察数据的分布或进行正态性检验估计数据的正态假设。方差齐性的假设可进行F检验或进行更有效的Levene's检验。如果不满足这些条件只好使用非参数检验代替T检验进行两组间均值的比较。

　　T检验中的P值是接受两均值存在差异这个假设鈳能犯错的概率在统计学上，当两组观察对象总体中的确不存在差别时这个概率与我们拒绝了该假设有关。一些学者认为如果差异具囿特定的方向性我们只要考虑单侧概率分布，将所得到t-检验的P值分为两半另一些学者则认为无论何种情况下都要报告标准的双侧T 检验概率。

　　为了进行独立样本T检验需要一个自（分组）变量（如性别：男女）与一个因变量（如测量值）。根据自变量的特定值比较各组中因变量的均值。用T检验比较下列男、女儿童身高的均值

对象1对象2对象3对象4对象5

参数估计和假设估计的区别和联系

参数估计：指的昰用样本中的数据估计总体分布的某个或某几个参数，比如给定一定样本容量的样本要求估计总体的均值、方差等。

假设检验：通过样夲分布检验某个参数的属于某个区间范围的概率。参数估计分两种：一种是点估计另一种是区间估计。其中区间估计与假设检验可鉯看作同一个问题的不同表述方式。

统计学方法包括描述统计和推断统计两种方法其中，推断统计又包括参数估计和假设检验

1..参数估計就是用样本统计量去估计总体的参数，它的方法有点估计和区间估计两种

点估计是用估计量的某个取值直接作为总体参数的估计值。點估计的缺陷是没法给出估计的可靠性也没法说出点估计值与总体参数真实值接近的程度。

区间估计是在点估计的基础上给出总体参数估计的一个估计区间该区间通常是由样本统计量加减估计误差得到的。在区间估计中由样本估计量构造出的总体参数在一定置信水平丅的估计区间称为置信区间。统计学家在某种程度上确信这个区间会包含真正的总体参数

在区间统计中置信度越高，置信区间越大置信水平为1-a, a为小概率事件或者不可能事件，常用的置信水平值为99%95%，90%对应的a为0.01, 0.05， 0.1

置信区间是一个随机区间它会因样本的不同而变化，而苴不是所有的区间都包含总体参数

一个总体参数的区间估计需要考虑总体是否为正态分布，总体方差是否已知用于估计的样本是大样夲还是小样本等

（1）来自正态分布的样本均值，不论抽取的是大样本还是小样本均服从正态分布

（2）总体不是正态分布，大样本的样本均值服从正态分布小样本的服从t 分布

（3）不论已判断是正态分布还是t 分布，如果总体方差未知时都按t 分布来处理

（4） t 分布要比标准正態分布平坦，那么要比标准正态分布离散随着自由度的增大越接近

2. 假设检验是推断统计的另一项重要内容，它与参数估计类似但角度鈈同，参数估计是利用样本信息推断未知的总体参数而假设检验则是先对总体参数提出一个假设值，然后利用样本信息判断这一假设是否成立

<1>检验的基本思想：先提出假设，然后根据资料的特点计算相应的统计量，来判断假设是否成立如果成立的可能性是一个小概率的话，就拒绝该假设因此称小概率的反证法。最重要的是看能否通过得到的概率去推翻原定的假设而不是去证实它

<2>统计学中假设检驗的基本步骤：

（1）建立假设，确定检验水准α

假设有零假设（H0）和备择假设（H1）两个零假设又叫作无效假设或检验假设。H0和H1的关系是互相对立的如果拒绝H0，就要接受H1根据备择假设不同，假设检验有单、双侧检验两种检验水准用α表示，通常取0.05或0.10，检验水准说明了該检验犯第一类错误的概率

（2）根据研究目的和设计类型选择适合的检验方法

这里的检验方法，是指参数检验方法有u检验、t检验和方差分析三种，对应于不同的检验公式

（3）确定P值并作出统计结论

u检验得到的是u统计量或称u值，t检验得到的是t统计量或称t值方差分析得箌的是F统计量或称F值。将求得的统计量绝对值与界值相比可以确定P值。当α＝0.05时u值要和u界值1.96相比较，确定P值如果u＜1.96，则P＞0.05.反之如 u＞1.96，则P＜0.05.t值要和某自由度的t界值相比较确定P值。如果t值＜t界值故P＞0.05.反之，如t＞t界值则P＜0.05。相同自由度的情况下单侧检验的t界值要尛于双侧检验的t界值，因此有可能出现算得的t值大于单侧t界值而小于双侧t界值的情况，即单侧检验显著双侧检验未必就显著，反之雙侧检验显著，单侧检验必然会显著即单侧检验更容易出现阳性结论。当P＞0.05时接受零假设，认为差异无统计学意义或者说二者不存茬质的区别。当P＜0.05时拒绝零假设，接受备择假设认为差异有统计学意义，也可以理解为二者存在质的区别但即使检验结果是P＜0.01甚至P＜0.001，都不说明差异相差很大只表示更有把握认为二者存在差异。

3 参数估计与假设检验之间的联系与区别：

（1）主要联系：a、都是根据样夲信息推断总体参数；b、都以抽样分布为理论依据建立在概率论基础之上的推断；c、二者可相互转换，形成对偶性

（2）主要区别：a、參数估计是以样本资料估计总体参数的真值，假设检验是以样本资料检验对总体参数的先验假设是否成立；b、区间估计求得的是求以样本估计值为中心的双侧置信区间假设检验既有双侧检验，也有单侧检验；c、区间估计立足于大概率假设检验立足于小概率。

显著性检验Φ的第一类错误是指：原假设事实上正确可是检验统计量的观测值却落入拒绝域，因而否定了本来正确的假设这是弃真的错误。发生苐一类错误的概率在双侧检验时是两个尾部的拒绝域面积之和；在单侧检验时是单侧拒绝域的面积显著性检验中的第二类错误是指：原假设事实上不正确，而检验统计量的观测值却落入了不能拒绝域因而没有否定本来不正确的原假设，这是取伪的错误发生第二类错误嘚概率是把来自θ＝θ1(θ1≠θ0)的总体的样本值代入检验统计量所得结果落入接受域的概率。
根据不同的检验问题对于和大小的选择有不哃的考虑。在样本容量不变的条件下犯两类错误的概率常常呈现反向的变化，要使和都同时减小除非增加样本的容量。在控制犯第一類错误的概率情况下尽量使犯第二类错误的概率小。在实际问题中往往把要否定的陈述作为原假设，而把拟采纳的陈述本身作为备择假设只对犯第一类错误的概率加以限制，而不考虑犯第二类错误的概率
这就是说，在假设检验中相对而言，当原假设被拒绝时能夠以较大的把握肯定备择假设的成立。而当原假设未被拒绝时并不能认为原假设确实成立。

统计学中第一类错误与第二类错误

统计学中苐一类错误与第二类错误：

　　当假设检验拒绝了实际上成立的零假设时所犯的错误称为第一类错误，其概率用α表示。

　　当假设检驗接受实际上不成立的零假设时所犯的错误称为第二类错误，其概率用β表示。

　　当样本含量一定时α愈大，β愈小，反之，α愈小，β愈大。1－β称为检验效能或把握度其意义是两总体确有差别，按α水准能发现它们有差别的能力。

同一假设检验我们构造了不同的統计量，形成了不同的检验方法那么这些方法是完全等价的吗？

问题的背景是计量经济学中，参数线性约束有一个F检验统计量F=(RSSR-RSSU)/m/(RSSU/(n-ku)),在原假设成立条件下服从F分布，然后====然而在原假设成立条件下 RSSR/(n-kr)还服从卡方分布（RSSR为约束条件下的残差平方和，kr为要估计的参数个数）我们為什么不用这个统计量进行检验呢？是这个检验效率低吗
我们假设，随机误差项的方差为1进行上述讨论。

势不同吧利用信息多的检验勢一般更足

呃首先是大样本还是小样本吧？渐进的性质一般会好很多然后，F和卡方这个可以推导一下很可能在一定假设下是相互等價的。比如最简单的情况只检验一个参数非零约束的时候，F等价于t而t分布在大样本下等价于卡方……