六西格玛的response surface是surface什么意思思

六西格玛统计(密)
2011年 六西格玛黑带认证培训教师 统计技术高级研修班天津大学 马逢时
上海1第五章 测量5.1 过 分析 文档 过程分析及文档 5.2 概率统计基础 5.3 数据的收集和整理 5.4 测量系统分析 5.5 过程能力分析2天津大学 马逢时1 5.2.2 随机变量及分布1. 离散型分布的分布律x P 1 0.1 2 0.2 3 0.3 4 0.3v s X5 0.1S c a tte r p lo t o f P0 .3 00 .2 50 .2 0P0 .1 50 .1 0 1 2 3 X 4 53天津大学 马逢时5.2.2 随机变量及分布2. 2 连续型分布的分布密度图5-14 概率密度函数所围成的面积等于14天津大学 马逢时2 5.2.2 随机变量及分布P (a ≤ X ≤ b) =∫bap ( x)d dx区间[a, b]上的概率,可由概率密度函数在该区间上的求积分 得到,如图5-15阴影部分所示密度函数有量纲 1/[X]。图5-15 区间[a, b]上的概率5天津大学 马逢时5.2.2 随机变量及分布中国成年男子身高抽样分布图 (n=1215)成年男子身高分布图正态 200均值 168.1 标准差 5.439 N 1213150频率100500 150 156 162 168 174 身高 180 186 192直方图高度受样本量影响, 受区间分割方法(分组方式)影响6天津大学 马逢时3 5.2.2 随机变量及分布分布密度图不受样本量及采样间隔区间划分影响。但横轴单位不 相同时, 高度是不同的。(高度有量纲:1/[X])分布图正态, 均值=168, 标准差=5.6 0.08 0.07 0.06 0.05 密 密度密度 8 7 6 5 4 3 2 1 0分布图正态, 均值=1.68, 标准差=0.0550.04 0.03 0.02 0.01 0.00150160170 X1801901.501.551.601.65 X1.701.751.801.857天津大学 马逢时5.2.5 正态分布一般正态分布用记号 般正态分布用记号 其中, μ 为均值, σ 2为方差 特别, 称 N(0,1) 为标准正态分布. 性质: 则 设X ~ N ( μ , σ 2 ) 表示X ~ N (μ ,σ 2 )X ?μZ=σ~ N (0,1)Z 值的含义要能深入理解。考试的“标准分”, 身高、体重的 Z 值代表在整个分布中的位置。8天津大学 马逢时4 一般正态分布与标准正态分布2 如果有 Y ~ N ( μ , σ ) ,令 z = 令y?μσ则 z ~ N (0,1)y?4σ ?3σ ?2σ ?1σ μ 1σ 2σ 3σ 4σz?4 ?3 ?2 ?1901234累积分布函数概念概念:Cumulative Function F(x) :当 x 给定后,F(x)代表 x 左方面积, 即随机变量X小于 x 的概率。 (显然,随x的增大,F(x)也增大;直到x无限增大, F(x)最后达到1)F(x)代表这块面积xx10X5 分位数(Quantile)概念当 p 给定后,XP代表 左方面积为p时, 横坐标 的位置。 显然,随p的增大, XP 也增大;直到随p增大到1, XP 也增大至于无限。 对于年分布,如果右侧概率为 1/T,则其分位数称为T年一遇值。例如, X0.99 为百年一遇值; X0.95 为廿年一遇值; X0.90 为十年一遇值。 p代表这块面积xxP11X对应Z值的理解某高校硕士生在期末考试实际成绩为72分,但折 算为z值时得到 z = -2。这说明什么? z值有什么 用? 因为 z = -2,说明大约只有2.28%的学生成绩比他 低。此学生成绩在班内比较差。z值作为描述其在 分布中的位置非常有用。 某位满周岁婴儿,其身高z值为1.3,其体重z值为 某位满周岁婴儿 其身高z值为1 3 其体重z值为 0.7。这是什么意思?说明此婴儿发育状况如何? 大约有90%的同龄婴儿比他矮,大约有76%的同 龄婴儿比他轻。他的总发育状况很好,但仍不够均 衡,在偏高的婴儿中他仍有些偏瘦。126 5.2 概率统计概念要点均匀分布例1:X? 1 , 0 ≤ x ≤ 2π ? f ( x) = ? 2π ? 0 , 其它 ?X为? 1 , ?π ≤ x ≤ π ? f ( x) = ? 2π ? 0 , 其它 ?X为(0,2π )上的均匀分布(?π , π )上的均匀分布13天津大学 马逢时5.2 概率统计概念要点均匀分布例2: 均匀分布例2计算过程中舍入误差(四舍五入)的分布为:?1, ? 0.5 ≤ x ≤ 0.5 f ( x) = ? 其它 ? 0,1-0.50.514天津大学 马逢时7 指数分布与元器件寿命规律一般失效规律复杂 呈浴盆曲线(Bathpool Curve): 般失效规律复杂,呈浴盆曲线(Bathpoolλ (t )早 期 失 效偶 然 失 效耗 损 失 效交付使用点更新点 时间t天津大学 马逢时15指数分布其分布密度及分布图形为: 其分布密度及分布图形为P(t)?λe ? λt t≥0 p(t ) = ? ? 0 t&0t 称“此时刻尚在工作,而下个时刻失效的概率”为“瞬时失效率”。 称 此时刻尚在 作 个时刻失效的概率 为 瞬时失效率 指数分布在可靠性分析中非常有用。指数分布密度式中的λ就是 瞬时失效率。 指数分布的瞬时失效率是不随时间而变的常量。16天津大学 马逢时8 指数分布注意 瞬时失效率是有量纲的, 其量纲为( /[时间]) 注意:瞬时失效率是有量纲的, 其量纲为(1/[时间]) 例如,某电视机瞬时失效率为0.0001/天, 表示此电视机今日尚在工作, 明日失效的概率为万分之一(以天为时间单位)。 何时可以使用指数分布?例如,电视机寿命通常有几十年,一台电视 机使用了2年或使用了3年之后,它们的瞬时失效率如何?由于造成此时 出现失效的只可能是偶然原因,因此可以认为使用了2年或使用了3年 之后瞬时失效率是相同的。 一般而言,有早期失效期(刚开始容易失效),还有老年的耗损失效 般而言,有早期失效期(刚开始容易失效),还有老年的耗损失效 期(太老的原器件会随使用时间的增加而使瞬时失效率增长)。在此 之间的正常工作期限内,可以假定瞬时失效率维持为一个常数。 数学上可以证明:瞬时失效率为常数的寿命分布只有一个----指数分 布(Exponential Distribution) 。17天津大学 马逢时指数分布下面讨论指数分布时的瞬时失效率与平均寿命。 下面讨论指数分布时的瞬时失效率与平均寿命 记瞬时失效率为λ,其平均寿命为μ,则有μ =1 / λ 结论:在指数分布中,失效率λ与平均寿命μ二者互为倒数。 例如,一台电视机瞬时失效率为λ =0.0001/天,则平均寿命为 μ =1 / λ =10000天(=27年)。 对于指数分布,标准差σ与平均寿命μ相同。 即 σ = μ =1 / λ 1 指数分布(Exponential Distribution)常用 E (λ ) 表示。18天津大学 马逢时9 Weibull分布失效率与分布函数关系: 失效率与分布函数关系 记失效率函数为 λ (t ) 1 若失效率为常数λ , 则寿命分布为指数分布, 平均寿命为 λ f (t ) = λ e ? λ t , t ≥ 0 λ (t ) = λ 若失效率函数为浴盆曲线,则寿命分布为Weibull分布λ (t ) = At k ?1f(t)=W(k,b)即Weibull分布这里, k为形状参数: k &1为早期失效分布; k&1为耗 损失效分布; k=1为指数分布。b为尺度参数。19天津大学 马逢时对数正态分布在可靠性分析中,常常遇到下列情况。 在可靠性分析中 常常遇到下列情况 元器件的寿命X明显不对称,不是正态,右面尾 巴拖得很长,即有很多元器件寿命很长。 如果将X取对数之后为正态分布,即LnX为均值 2 是μ,方差是 σ 的正态分布,则我们称X为对数正 态分布。记为X~LnN(μ, σ 2 )。 注意: EX≠ e ,正确公式为 EX = exp{μ + 2 }μσ220天津大学 马逢时10 二项分布定义:在独立试验中,若每次出现 成功 的 定义:在独立试验中,若每次出现“成功”的 概率固定为 p,则若记 n 次独立试验中出现 “成功”的总次数为X,则称 X 的分布为二项 分布,记为 X ~ B ( n, p ). 若 X ~ B ( n, p ),则 X的均值是 μ=np , 方差 σ 2= np(1-p).本车间生产的二极管中不良率为0.2,每盒装100支二极管, 则每盒中的不良二极管数为二项分布B(100, 0.2)。 京津高速公路上日流量为10000辆,每辆车出事故的可能性都 是0.0003,则每日发生事故数分布为B(10000, 0.0003)。21天津大学 马逢时泊松(Poisson)分布稀有事件出现次数的分布常常为Poisson分布。 例如, 福州市每年遭受台风侵袭的次数; 一匹布内的 暇疵点数;某道口每年发生车祸次数;每个电镀零 件上的斑点数;午餐店在营业时间内每分钟顾客到 来的人数;等等。 Poisson分布只要一个“平均值”参数λ就可以完全 确定, Poisson分布记为P(λ)。 例如,已知M快餐店中午每分钟平均到来5名顾客, 例如 已知M快餐店中午每分钟平均到来5名顾客 则顾客到来人数X为Poisson分布P(5),记为X~ P(5)。 如果平均值较大,可以分成更小单位(例如将每分 钟分为6个10秒的间隔)计数。22天津大学 马逢时11 Poisson分布性质Poisson分布的均值及方差: P(λ)的均值及方差都是λ。 概率分布很多种,只有Poisson分布的均值及方差是相等 2 的。注意:均值的量纲为[x],方差量纲为 [x ] ,因而 Poisson分布一定是无量纲的,否则二者不可能相等。 Poisson分布的均值 λ 可分性. 每块芯片上的暇疵点的分布为P(2),集成电路中含4块 同样的芯片,则集成电路中总暇疵点数的分布为P(8)。 例如:若 周事故次数 X的分布为 P(4),则 天事故次 例如 若“周事故次数”X的分布为 P(4) 则“天事故次 数” Y 的分布为 P(4/7). 例如:若1000平米瑕疵米均值为3.5个,问100平米瑕疵米为 什么分布?23二项分布计算0 9)时 则二项分布 1. 当n较大,p中等(0.1 1 当n较大 p中等(0 1 &p& 0.9)时,则二项分布 近似于正态分布。B(n,p)近似于 N (np,np(1-p) ) 假定生男生女概率相等,在某城市新生的10000个 婴儿中,男孩的总个数X~B(1)。 均值μ=np=5000 , 方差 σ 2 = np(1-p) =2500, 标准差 σ=50。平均说来,应该有 平均说来,应该有5000个男孩。4倍标准差为200,所以落 个男孩 倍标准差为 ,所以落 在4倍标准差之外,即落在()之外的概率小于万 分之一;或说预报范围()万无一失。 在单值控制图中,记录了100个观测点,落在中心线上方的点 数近似为什么分布?天津大学 马逢时2412 二项分布计算2。 当n较大,p较小(&0.1),np不大(不超过20)时, 2 当n较大 p较小(&0 1) np不大(不超过20)时二项分布与Poisson 分布很接近。 即B(n, p) ~ P(λ ) , 这里λ = np京津高速公路上日流量为10000辆,每辆车出事故的可能性 都是0.0003,则每日发生事故数分布为B(10000, 0.0003) 用计算机计分别算出B(13)及P(3)的前20项概率 值。二者数值非常接近。25天津大学 马逢时5.2 常用分布要点1. 概率分布密度和累积分布函数。 2. 离散分布的 3 种(二项,泊松、超几何) 3. 连续分布的 4 种(正态、指数、均匀、Weibull) 4. 常用4个分布的均值、方差公式。二项 项 期望 方差 泊松 正态 指数12npλ λμσλnp(1 ? p)1λ226天津大学 马逢时13 5.2 统计基本概念:总体与样本总体 Parameter (常数) 位 置 均值(mean) 中位数(median) 四分位数(quartile) 方差(variance) 标准差(standard deviation) 极差(range) 四分位间距(inter-quartile range)27μ样本 Statistics (随机变量)mLQ UQσ2LQ UQx ~ x散 布s2σsRIQRIQR天津大学 马逢时5.2 概率统计概念要点均值 μ 与中位数m 与中位数m. 均值是分布的“重心”,中位数是两侧各占50%.1)分布对称时,二者相等. 2)分布正偏时, μ &mμm28天津大学 马逢时14 偏度与峰度一般地说,对于分布的描述用位置状况、散布状况就够。 如果还需要对分布的形状作更细致描述的话,那就要用到偏度和峰 度了。以下为了解释偏度和峰度说起来方便,假定几个分布的均值 和方差全相同。 偏度(Skewness)是描述对称性的。 sk&0(负偏) sk=0(对称), sk&0(正偏)29天津大学 马逢时偏度与峰度峰度( Kurtosis)是描述分布高峰处及尾部所占的比重的。 规定正态分布的峰度为0。假定两个分布均值和标准差全相 同。则峰度为正时图形特征是:顶峰处更高,两端尾部更 大,也即更慢地趋于0。则峰度为负则相反。峰度为正: 顶峰更高 两尾更重 峰度为负: 顶峰更矮 两尾更轻正态分布 峰度为0 峰度为30天津大学 马逢时15 5.2.7统计量与抽样分布设 则 可以化为 还有,X i ~ N ( μ , σ 2 ), i = 1,..., n.X ~ N (μ ,Z =σ2nσ)~ N ( 0 ,1 )X ? μ nT=X ?μ ~ t (n ? 1) s n这里, t (n) 是自由度为n 的 student T-分布. T分布与标准正态分布形状相同,只是更分散。天津大学 马逢时315.2.6 中心极限定理中心极限定理: 中心极限定理不论原始分布为何种分布,当样本量无限增大时, 样本均值的分布都趋向于正态分布。 当原始分布对称时, n =5,近似已很好。 当原始分布不对称时,n=30,近似已很好。样本均值性质:σx =σn32天津大学 马逢时16 5.3 数据的收集和整理5.3.1.数据的类型: 4类测量尺度. 5.3.2 收集数据的方法: 5.3.3 抽样方法: 强调代表性.关键是:抽样要具有代表性,否则结论无意义。例如,美 国总统1948年Truman与Dewey竞选;意大利非亲生子女 14%;二战中飞机弹着点分布;发病率调查;某现象出现 率问卷调查、网上调查等。5.3.4 描述性统计方法 5.3.5 数据的图示方法:图(游程图), 正态概率图.直方图, 茎叶图,箱线图, 链33天津大学 马逢时5.3.1 测量和测量等级测量:按照某种规则赋予每个被观测的对象 测量:按照某种规则赋予每个被观测的对象一 个值。此值可以是数值,也可以是符号。 测量可以划分为四个等级:离散型:名称尺度等级(Nominal Scale) 顺序尺度等级 (Ordinal Scale) 连续型:间距尺度等级(Interval Scale) 比率尺度等级 ( Ratio Scale)自上而下,测量级别越来越高,测量的精度、 困难程度、以及数据所含的信息也越来越高。34天津大学 马逢时17 5.3.1.1 名称尺度等级每个观测值只是对象所属类别的名字或代码. 每个观测值只是对象所属类别的名字或代码 名称尺度是最低的级别:不具有顺序的性质,更不具 有距离的性质。 名称尺度测量只能根据每个特性区别不同对象的类 别。例如,产品的型号、编码、类别、形式等。 对于名称数据,基本的数据整理工作是计数,数出 某个名称值出现的次数; 某个名称值出现的次数 即使名称数据是代码数值,比较大小与加减乘除运 算没有实际意义 它对于任意单值一一对应函数保持不变。35天津大学 马逢时5.3.1 2 顺序尺度等级观测值标明了各对象所属性的顺序. 按事物的某特性,将观测对象排序(名次),就达到 顺序尺度等级。例如,上、中、下三个质量级别; 某些质量指标的评级或评分;年龄组;空气质量 等级;喜好度;风级等。 顺序数据之间比较大小有意义,而两个数据的差 别(距离)没有实际意义,因此严格说,平均数是无 意义的。 意义的 它对于任意单调函数保持不变。36天津大学 马逢时18 5.3.1.3 间距尺度等级(区间型)观测值不仅标明了各对象所属性的顺序,而且 观测值不仅标明了各对象所属性的顺序 而且 其数 据间的差距是可以比较的.称为间距尺度等级(interval scale) 其测量得到的数据,不仅可以说明某物的某特性的值 比另一物同一特性的值大或小,且可以说明该特性相 差多少。但因为无起始点,因而讨论比值、倍数都是 无意义的 。 例如,华氏(或摄氏)温度(“3月12日均温比11日 上升了一倍”不对) ;智商得分;日历。 它对于任意线性函数保持不变37天津大学 马逢时5.3.1. 4比率尺度等级(比值型)观测值不仅标明了各对象属性的顺序及差距,而且其 观测值不仅标明了各对象属性的顺序及差距 而且其 数据间的比值是有意义的. 即测量的“零点”有确定 的实际意义,测量达到比率尺度等级。 例如,称重读数为零表示没有重量;温度测量采用绝 对温度,绝对零度表示分子静寂的状态;长度为零或 货币为零表示全空。 两个比率尺度数据的和或差以及商,有实际意义。 两个比率尺度数据的和或差以及商 有实际意义 它对于任意倍比函数保持不变。因此,货币额、长度、 重量、时间间隔不同单位间可以进行换算。38天津大学 马逢时19 5.3.1.4比率尺度之对数型指标等级以比率尺度绝对量之对数作为其指标。其差值具有 比值含义,因而常有负等级。 例如:躁音等级: 视星等(Pogson标度):1等星之差异对应量度之比 为2.512(倍). (2.512**5=100) 地震震级(里氏级):1震级之差异对应地震能量之 比为32(倍). (即0.2级为2倍, 2**5=32) ( ) ( , ) 亮度,压力,音响。 这种指标的“算术平均”是没有意义的。39天津大学 马逢时5.4 测量系统分析5.4.1 541 5.4.2 5.4.3 5.4.4 5.4.5 545 5.4.6 5.4.7 基本概念 测量系统的分辨力 测量系统的偏倚、线性和稳定性 测量系统的重复性与再现性 破坏性试验的测量系统分析 非连续数据的测量系统分析 测量仪器的校准和检定40天津大学 马逢时20 5.4.1 测量系统概念1) 测量系统定义注意:测量系统并不就是测量仪器2) 表征测量数据质量的统计指标Bias: Precision: 偏倚 精(确)度σ MS基准值 测量平均值41天津大学 马逢时测量系统的基本概念测量系统的结果很类似于射击。好的测量系统应该是哪种情形?没有系统偏差, 但太分散分散很小, 分散很小 但有系统偏差分散很小, 分散很小 且 没有系统偏差记住:要同时考虑“是否有系统偏差”, “是否太分散”两方面性质42天津大学 马逢时21 5.4 测量系统(连续量)的基本要求1)分辩力(Discrimination) 2)稳定性(Stability) 3)偏倚(Bias) 4)偏倚的线性性(Linearity of Bias) 5)重复性(Repeatability)和再现性(Reproducibility) 6)精度(Precision) 。 7)精度的线性性(Linearity of Precision) 。 8) 测量系统合格标志: GageR&R 及P/T Ratio43天津大学 马逢时5.4 测量系统的基本要求5 4 2 分辩力(Discrimination) 5.4.2, } 10 10 例如钢板尺,最后一位四舍五入时,unit为1mm。最后一位有 半毫米刻度,或可以容许读半毫米时,unit为0.5mm。足够的分辩力是对中心量具最小间距(Unit)的要求. 6σ USL ? LSLunit ≤ min{这是最起码的要求,是测量系统合格的必要条件。 有时另用可区分类别数(ndc)作为分辨力指标(定 义见168页), ndc≥10代表测量系统优秀, ≥5合格。44天津大学 马逢时22 5.4.3 稳定性(Stability)理论定义:测量结果的分布不随时间而改变. 理论定义:测量结果的分布不随时间而改变 实际定义:测量结果分布的均值、方差、形状不随时间而 改变。 准确检测:用控制图来检测。 实际检测:先画均值、方差趋势图来判断。然后画控制图。 控制图理论在第八章介绍。45天津大学 马逢时5.4 测量系统的基本要求5.4.3 偏倚(Bias)对某点处的Bias检验要进行1-std的检验 结论要明确:Bias是否存在,Bias 是多少。5.4.3 偏倚(Bias)的线性性 (Linearity)Bias是否可以修正,如何修正。 若Bias有线性,则可以通过线性关系加以修正 若Bias有线性 则可以通过线性关系加以修正 修正的关键是求出Bias的线性回归方程 Bias线性性的两种表达方式:常用下页左图。 MINITAB的线性检验46天津大学 马逢时23 5.4.3 偏倚线性性的表达方式?考查测量系统的偏倚通常只是针对某一点进行的,偏倚的线性 考查测量系统的偏倚通常只是针对某 点进行的,偏倚的线性 性则是对整个测量范围(即生产过程的全变差)考虑的。要回答 的问题是:在整个范围内偏倚的状况是什么样的.Bias测量均值bias无偏真值47天津大学 马逢时评估测量系统的标准:线性性(Linearity)测量系统的线性是指在其量程范围内,偏倚是基准值的线性函数 偏倚 有线性性 偏倚无线性性真值 真值文件:MSA偏倚线性.mtw4824 5.4 测量系统的基本要求5.4.4 重复性和再现性. 5 4 4 重复性和再现性 重复性(Repeatability)重复性反映的是测量仪器固有的变异.再现性(Reproducibility)现 再现性反映的是测量系统中其它所有原因产生的变异. 再现性误差可以通过改进操作加以改进.49天津大学 马逢时5.4 测量系统的基本要求5.4.4 精(确)度(Precision).精(确)度是重复性与再现性的总和. ( ) ( )2 2 2 σ MS = σ RPT + σ RPD5.4.4 精(确)度的线性(Linearity of Precision) 指量程内最不利处的精(确)度PrecisionRange50天津大学 马逢时25 5.4 测量系统的基本要求5.4.4. 5 4 4 测量系统合格标志:GaugeR&R 及GaugeR & R =P/T Ratioσ 6σ MS = MS 6σ Total σ Total强调测量系统对分析过程指标的分析性能 6σ MSRatio of P / T = USL ? LSL强调测量系统对公差限的分析性能51天津大学 马逢时5.4.4 测量系统合格标志GageR&R 及 P/T Ratio两个比值都小于10%――测量系统合格 两个比值介于10%~30%―― 所测量之量并非关键量,且改进测量系统在 经济上不可行 经济上不可行――可以使用。 可以使用 否则不可使用。 两个比值都超过30%――测量系统不合格52天津大学 马逢时26 5.4测量系统分析(MSA)方法1)先不考虑过程变差。只对标准件做测量分析,细致考虑测量系统本身各项构成。 测量系统分析细致,但只有P/T 比值。 测量系统合格,则MSA结束; 否则分析变异原因设法改进。(下同)2)同时考虑过程变差A. 传统型二交叉因子方法: A 传统型二交叉因子方法 结果全部自动给出(极差法、ANOVA法)。 B. 一般分析方法(ANOVA及方差分量计算): 最后再用手算出 最终指标%GageR&R及 P/T53天津大学 马逢时5.4 测量系统分析例1:测厚仪例1. 连续量不考虑过程变异。 例1 连续量不考虑过程变异用数字测厚仪对于镀膜厚度进行测量。 已知镀膜厚应为3000A, 对此件厚度用更精密仪器测 量结果为3066.5A。 公差限为 3000A +/- 100A。 测量系统的分析在一周的5天内进行;每次测量要先卸 载再加载才能完成, 每天都进行5次卸载/加载循环。 每次测量都重复 2次. 全部数据记录于MSA镀膜测厚.mtw中. 试计算出P/T比, 分析此测量系统是否合格.54天津大学 马逢时27 多变异图555.4测量系统分析例1:测厚仪嵌套方差分析: 厚度 与 日, 循环 方差分量 来源 方差分量 总和的 % 标准差 72.00 2.691 日 7.239 14.87 1.223 循环 1.495 13.13 1.149 误差 1.320 3.171 合计 10.054Reproducibility Repeatability Precision(σMS)%P/T=6 σMS /Tolerance=6*3.171/200=0.0951. 此测量系统合格。 此时,不必再分析各部分构成。56天津大学 马逢时28 5.4测量系统分析例2:糖果测重仪例2. 对于糖果测重仪进行分析。 例2 对于糖果测重仪进行分析选择3个操作员,对10包糖果分别测量了3次。 糖果重量要求的公差限为 45.5 +/- 0.5(公斤)。 全部数据记录在文件 MSA糖果测重.mtw中. 试计算GageR&R及P/T指标值,分析测量系统的合格性. 因子:操作员,糖果包. 二者是交叉关系. 直接使用: 统计-质量工具-量具研究直接使用 统计 质量工具 量具研究 -量具GageR&R研究(交叉) 也可以使用统计-ANOVA-一般线性模型57天津大学 马逢时5.4测量系统分析例2:糖果测重仪研究变异 标准差(SD) 来源 0.067596 合计量具 R&R 重复性 0.032592 再现性 0.059220 检验员 0.028470 检验员*糖果包 0.051928 部件间 0.189745 合计变异 0.201426 可区分的类别数 = 3 %研究变异 %公差 研究变异 公差 (6 * SD) (%SV) (SV/Toler) 0. 40.56 0. 19.56 0. 35.53 0. 17.08 0. 31.16 1. 113.85 1. 120.86测量系统不合格。 主要原因是测量仪器本身误差太大。58天津大学 马逢时29 5.4测量系统分析例3:断裂强度仪子 带嵌套 带嵌套的双因子 测量系统分析; 系 分析 3个测量员,分别测试了不同的5个零件,每个 零件皆测量2次。 结果列在 MSAnest.mtw中 试计算gageR&R指标,并分析测量系统的合格性. 因子:测量员与零件。二因子关系是嵌套的。59天津大学 马逢时5.4测量系统分析例3:断裂强度仪60天津大学 马逢时30 5.4测量系统分析例3:断裂强度仪来源 合计量具 R&R 重复性 再现性 部件间 合计变异 研究变异 标准差(SD) 1.49 0.74 1.25045 %研究变 (6 * SD) 异 (%SV) 6. 6. 0. 3. 7.可区分的类别数 = 161天津大学 马逢时5.4测量系统分析例3:断裂强度仪62天津大学 马逢时31 5.4.5 离散测量系统分析的基本要求1. 测量结果错误定义。选25件产品其中10件“True” ,10件“False”,5件不易分辨者。 选3~4个测量员, 每个测试者对每个产品测试两次。下列情况算错误: 1)同一测量员对同一零件测量结果不一致 2)同一测量员对同一零件测量结果一致,但与正确结果不一致。 3)不同测量员对同一零件测量结果不一致。 4)不同测量员对同一零件测量结果一致,但与正确结果不一致。2. 离散测量系统合格标志:1)错误率小于10%――测量系统合格 2)错误率介于10%~20%――所测量之量并非关键量,且改进 测量系统在经济上不可行――可以使用。否则不可使用。 3)错误率大于20%――测量系统不合格。63天津大学 马逢时5.4.5 离散测量简单系统分析对目测合格品系统进行简单测量系统分析。选25件产品其中10件“True” ,10件“False”,5件不易分辨者。选3~4个测量员, 每个测试者对每个产品测试两次。 数据记录在AtMSA.mtw内(数据记录在单列中). 从统计-质量工具-属性一致性分析入口在属性列 窗口中填入: 窗口中填入 窗口中填入: 在样本 窗口中填入: 在检验员 在已知标准/属性 窗口中填入: Answer Ans e Question Operators Standard64天津大学 马逢时32 5.4.5 离散测量简单分析例1(重复性)检验员自身 (Repeatability) 评估一致性 检验员 # 检验数 # 相符数 百分比 95 % 置信区间 A 25 25 100.00 (88.71, 100.00) 25 25 100.00 (88.71, 100.00) B C 25 24 96.00 96 00 (79.65, 99 90) (79 65 99.90) 25 25 100.00 (88.71, 100.00) D # 相符数: 检验员在多个试验之间,他/她自身标准一致。.65天津大学 马逢时5.4.5 离散测量系统分析例1Fleiss Kappa 统计量 Kappa Kappa 标准误 1. 1. 1. 1. 0.48 0.2 02 0. 1. 1. Z 5.00 5.00 4.42 4.00 5.00000(重复性检验)检验员 响应 A False True B False True C False F l True D False TrueP(与 & 0 ) 0.0 0.0 0.0 0.0 0.000066天津大学 马逢时33 卡帕值解释B判0 A判0 A判1 总计 3* 1 4 B判1 2 4** 6 总计 5 5 10 A B ● ○ ● ○ ● ○ ● ○ ● ○ ○ ● ○ ○ ● ● ● ● ○ ●A:○5 ●5 B:○4 ●610 × 5 4 × =2 10 105 6 × =3 10 107 5 ? 1 0 = 1 0 5 1 ? 1 0 2 5表面正确率:7/10 *处蒙对○ ○个数为: **处蒙对● ●个数为:κ=10 ×675.4.5 离散测量系统分析例1(偏倚)每个检验员与标准 评估一致性 检验员 # 检验数 # 相符数 百分比 25 25 100.00 A 25 24 96.00 B C 25 24 96.00 D 25 25 100.00 95 % 置信区间 (88.71, 100.00) (79.65, 99.90) (79.65, 99.90) (88.71, 100.00)# 相符数: 检验员在多次试验中的评估与已知标准一致。68天津大学 马逢时34 5.4.5 离散测量系统分析例1(偏倚)评估不 致 评估不一致 # False检验员 # True / False 百分比 # False/ True 百分比 # Mixed 百分比A B C D0 1 0 00.00 8.33 0.00 0.000 0 0 00.00 0.00 0.00 0.000 0 1 00.00 0.00 4.00 0.00# True / False: 多个试验中误将标准 = False 者一致评估为 = True 的次数 # False / True: 多个试验中误将标准 = True 者一致评估为 = False 的次数 # Mixed: 多个试验中所有的评估与标准不相同者。69天津大学 马逢时5.4.5离散测量系统分析例1 (准确性检验)Fleiss Kappa 统计量 检验员 响应 Kappa Kappa 标准误 False 1.421 A 0.141421 True 1.00000 False 0.421 B 0.421 True False 0.421 C 0.421 True False 1.421 D 1.421 True Z P(与 & 0 ) 7.0 7.0 6.0 6.0 6.0 6.0 7.0 7.070天津大学 马逢时35 5.4.5 离散测量系统分析例1检验员之间 评估一致性(Reproducibility) 95 % 置信区间 # 检验数 # 相符数 百分比 24 96.00 (79.65, 99.90) 25 # 相符数: 所有检验员的评估一致。 Fleiss Kappa 统计量 响应 Kappa Kappa 标准误 Z False 0...0 True 0.95693271P(与 & 0 ) 0.0天津大学 马逢时5.4.5 离散测量系统分析例1所有检验员与标准 评估一致性 # 检验数 # 相符数 百分比 24 96.00 25 95 % 置信区间 (79.65, 99.90)# 相符数: 所有检验员的评估与已知的标准一致。 Fleiss Kappa 统计量 响应 Kappa Kappa 标准误 Z 0..7151 False 0....7151 TrueP(与 & 0 ) 0.072天津大学 马逢时36 5.4.5 离散测量系统分析例173天津大学 马逢时计数型测量细致系统分析例4. 计数型测量系统分析的方法: 一致性分析法1) 例题背景介绍: 对测量合格品系统进行测量系统分析 选50件产品,其中10件明显不合格品, 28件明显合格品, 12件处在边缘区(Ⅱ区,其中6件不合格,6 件合格)。 选3个测量员,每个测量员对每个产品测量3次 在 数据原始记录在AttriMSA.mtw内。 数据原始 内 在测量结果列及Std列内,0为不合格,1为合格。 在Group列内给出详细真实状况,-为明显不合格,+为明 显合格,X为处于边缘。7437 计数型测量系统分析例2) 收集的数据(在AttriMSA.mtw中)75计数型测量系统分析MINITAB : 统计-质量工具-属性一致性分析76天津大学 马逢时38 测量结果不一致的全部记录如下:No6 7 14 21 22 26 30 34 36 43A11 1 1 1 0 0 0 0 1 1A21 1 1 1 0 1 0 0 1 0A30 1 0 0 1 0 0 1 0 1B11 1 1 1 0 0 0 0 1 1B21 1 1 0 1 0 0 0 1 1B30 1 1 1 0 0 1 1 1 1C10 1 1 0 1 0 0 1 1 1C20 1 0 1 1 0 0 1 0 1C30 0 0 0 1 1 0 1 1 0StdV1 1 1 1 0 0 0 0 1 1这里10件产品全部位于边缘区域。所有检验员对于其余40件产品 (12件不合 格,28件合格, 40件中还包括2件处于边缘区域) 的各次检验的判断都正确。77Fleiss 的 kappa 统计量为了度量测量结果的一致性所用的一个统计量。这里,对于两个测量 员间的一致性,或是一个测量员与标准答案间的一致性都可以使用此 员间的 致性 或是 个测量员与标准答案间的 致性都可以使用此 统计量。Kappa = 1,代表二者完全一致。 Kappa = 0,表示一致程度 与偶然的瞎浣峁嗤Kappa只用于两个变量具有相同的分级值和相 同的分级数的情况。 Kappa的计算结果由MINITAB直接提供。 其计算原理大体上是这样:在右表中,先求 出沿对角线N1及N4格子中的计数(判断一致 者),再算 瞎 致 应有结果。 者),再算“瞎湟恢隆庇τ薪峁 设Po = 判断一致之比率, Pe=瞎湟恢碌谋嚷剩扑慊硭悖 则 Kappa =(Po - Pe)/(1 - Pe) 当“B”改为标准答案时,此即A与标准答案的一致性。78天津大学 马逢时B判0 A判0 A判1 总计 N1 N3 1+3B判1 N2 N4 2+4总计 1+2 3+4 总和39 计数型测量系统分析例i Within Appraisers Withi A Assessment Agreement Appraiser #Inspected #Matched 1 50 42 2 50 45 3 50 44 Percent 84.00 90.00 88.00 95 % (70.89, (78.19, (75.69, ( CI 92.83) 96.67) ) 95.47)评价人在所有试验上自己的一致性,如上表所显示。79天津大学 马逢时计数型测量系统分析例Each Appraiser vs Standard Assessment Agreement Appraiser #Inspected #Matched Percent 1 50 42 84.00 2 50 45 90.00 3 50 41 82.00 95 % CI (70.89, 92.83) (78.19, 96.67) (68.56, 91.42)评价人在所有试验上与基准的一致性如上表,一致性高于80%才是可 以接受的,达到90%才是优秀。 本例中,测量员B达到优秀,A,C可以接受。80天津大学 马逢时40 计数型测量系统分析例Assessment Disagreement Appraiser 1 2 3 #1/0 Percent 0 0.00 0 0.00 2 12.50 #0/1 0 0 1 Percent #Mixed Percent 0.00 8 16.00 0.00 5 10.00 2.94 6 12.00# 1 / 0: 是将 0测为 1(漏判): # 0 / 1: 是将 0测为 1(错判): #Mixed: 判断不一致的件数及占总件数百分率. 对于C而言,一致的漏判有2次,一致漏判率为 2/16 = 12.5%. 一致的错判有1次,一致错判率为 1/34 = 2.94%.81天津大学 马逢时计数型测量系统分析例All Appraisers vs Standard Assessment Agreement #Inspected #Matched 50 40 Percent 95 % CI 80.00 (66.28, 89.97)测量系统总有效率: 50件中,有40件所有测量员 意见一致而且与标准答案一致, 正确率达到80%。此 测量系统勉强达到合格标准。82天津大学 马逢时41 计数型测量系统分析例汇总结果实际0 A判0 A判1 总计 45 3 48 实际0 B判0 B判1 总计 45 3 48 实际0 C判0 C判1 总计 41 7 48 实际1 5 97 102 实际1 2 100 102 实际1 10 92 102 总计 50 100 150 总计 47 103 150 总计 51 99 150作为整个系统,正确率为80%, 本测量系统勉强可以接受。 本测量系统勉强可以接受效率 A B C 84 90 82 漏判 误判 结论 可接受 可接受 不可接受3/48 5/102 3/48 2/102 7/48 10/102测量员接受标准: 测量员接受标准效率 可接受 接受边缘 不可接受83漏判 ≤2% ≤5% &5%误判 ≤5% ≤10% &10%天津大学 马逢时≥90% ≥80% &80%第6章 分析6.1 61 6.2 6.3 6.4 6.5 探测性数据分析和过程分析 假设检验 方差分析 列联表 非参数检验8442 6.1.3 参数的点估计及区间估计1 参数的点估计 无偏性 方差尽可能小 参数的点估计:无偏性;方差尽可能小。 ? ? μ=X (中位数) μ=X ? ? ? σ 2 = s 2 σ = s 偏小 ; σ = s c4 无偏? σ= R d2 带子组的极差或 不带子组的移动极差2 区间估计1. 置信区间与置信水平:水平越高,区间平均长度越长。 2. 通常取 95%CI, 个别取90%,99%。 3. 不用考虑公式推导, 会用计算机计算即可。856.2 假设检验6.2.1 假设检验的基本概念1. 假设检验的问题,三种比较类型,单侧与双侧; 2. 基本概念与步骤, 两类错误,显著性水平,零假设和备择假设的 选取,说服力, 进行检验的步骤,判断的依据.6.2.2 平均值、方差和比率的假设检验1. 单个正态总体均值的显著性检验, Z、T检验的选取。 2. 两个正态总体均值相等性检验, T检验的选取。 3. 两个正态总体方差的相等性检验, F检验的选取. 4. 两个总体比率的相等性检验,6.2.3 成对检验 6.2.4 拟合优度检验8643 6.2.1 假设检验的基本概念工程问题陈述例题1: 冷拉钢筋生产线提供新生产工具的供应商称,他们的机器将提高冷拉钢筋的平均抗拉强度。原来此生产线冷拉钢筋的平 均抗拉强度2000公斤,标准差为300公斤。 为检验该供应商的承诺,我们购买并安装了一台新机器。试生产 稳定后,本项目的指定工程师从一周的生产中随机抽取了25根冷 拉钢筋,此样本得出的平均抗拉强度为2150公斤。 该生产工程题应该得出怎样的结论?该工程师愿意承担5%的结论 错误风险,认定新生产线徒有名地“提高了”平均抗拉强度。87比较问题的类型比较的类型1. 单样本问题: 1-to-Standard Comparison 2. 两样本问题: 1-to-1 Comparison 3. 多样本问题: Multiple Comparison比较的方向:单侧与双侧如果没有大于或小于的要求,而只是希望检验 等于 或 不等于 如果没有大于或小于的要求,而只是希望检验“等于”或“不等于” 某值,则此问题是一种两边的对比。 如果有大于或小于的要求,希望检验的“是否大于”或“是否小于” 某值,则此问题是一种单边的对比。8844 检验问题的分析检验问题的大前提。 参数空间:所有可能结果的范围。 参数空间的分割。 *张先生是否欠款?{不欠;欠}。 *罐中3个黑白球,抽中白球概率{1/3;2/3} *原来钢筋平均抗拉强度 μ = 2000 ,问是否提高?{μ ≥ 2000} = {μ = 2000} ∪ {μ & 2000}{μ 任意} = {μ ≤ 2000} ∪ {μ & 2000}两种考虑方法都是容许的,方法与结果也相同。 参数空间的设定必须与原有问题对应,否则问题本身就不合理。 例如:抽样平均值为1900,问:是否比2000有提高?89构建零假设及对立假设从逻辑的角度讲,推翻一件东西要比证明一件东西容易。 自 说法 “正常的”“不证自明的”说法用 H0 表示; “要证明的”、“推翻正常的”说法用HA表示。 零假设: 对立假设: H0 正常(只包含相等性)的假设。 HA 待检验的非正常的假设我们的判断结论只可以是“拒绝”或“无法拒绝”H0 。 说服力:“拒绝”是有说服力的; “无法拒绝”是无说服力的。 我们永远无法说“接受” H0 ,或“ H0正确” 。 “无法拒绝”与“接受”是有差别的,此判断决不可能是有说服力的结论。 例:实际问题的选择:证明“提高了性能”与证明“未降低质量水平(节 约成本、时间)” 选择是不同的。三聚氰胺的检验。足球的手球判断。9045 6.2.1 假设检验的基本步骤: μ 例 例1 给出假设:H0: = 2000 HA : & 2000 μ样本得出的冷拉钢筋的平均抗拉强度2150。根据这一证据, 工程师该如何判断? 平均抗拉强度达到多少才是足够的?如果该工程师所得结果 分别是、2500,情况会是怎样? 假设已知σ,则在原假设成立时,在平均值上应用抽样分布 定理 应该有 定理,应该有: X ?μ Z= ~ N (0,1) σ n X ? μ 2150 ? 2000 = = 2.50 代入具体数值得: Z = σ 300 n 2591Z统计量与标准化的正态分布? 假设已知 假设已知σ,则在原假设成立时,在平均值上应 则在原假设成立时 在平均值上应 用抽样分布定理,应该有:Z= X ?μσ~ N (0,1) X ?μ = 2150 ? 2000 = 2.50 300 25n代入具体数值得: 代入具体数值得Z=σn9246 MINITAB 结果从 统计 基本统计 1Sample Z 从“统计-基本统计-1Sample Z” 入口,注意 在“选项”中,选定对立假设类型为“大于”。单样本 Z: 强度 mu = 2000 与 & 2000 的检验 假定标准差 = 300 平均值 变量 N 平均值 标准差 标准误 强度 25 .0 60.095% 下限 Z P .50 0.00693判断法则1. 根据 P {Z&2.50} = 0.006 应该拒绝原假设.?显然,如果我们的零假设为真时,出现“Z=2.50 或更大”是一 种非常罕见情况。此可能性远远小于二十分之一 (α =0.05)。 此值称为 p-value。 即“在原假设成立的条件下,出现目 前状况的可能性”,也可以说“此时拒绝原假设犯第一类 错误的概率”。当p-value 很小时,则应该拒绝原假设。通常,如果 通常 如果 p-value & 0.05, 则拒绝原假设 0 05 则拒绝原假设。2. Z统计量值超过标准正态分布的分位数:Z & z0.95 = 1.645本例Z=2.50&1.645,故应拒绝原假设,即认为平均抗拉 强度确实比原来的2000公斤有提高。9447 另两个判断法则3. 由Z&1.645可以反解出 XZ = X ?μ的范围, 即 X 的临界值.σ=nX ? 2000 & 1 .6 4 5 300 25X & 2000 + 1.645 ×结论:如果25根钢筋的平均抗拉强度超过2098.7公斤,则说明钢 筋平均抗拉强度确有提高, 否则是由误差波动造成的“提高”。300 = 4. 根据置信区间:单侧假设检验将导出单侧置信区间。300 , ∞) = (2051.3, ∞) n 25 原假设的均值为 2000 未落入此区间内,因此应拒绝原假设。 ( X ? 1.645 × , ∞) = (2150 ? 1.645 ×95σMINITAB 结果强度 的直方图(平均值的 Ho 和 95% Z 置信区间,标准差 = 300) 5 4 3 频率 2 1 0Ho _ X150018002100 强度240027009648 双侧检验例. 假设在数据文件 BS芯片镀膜.mtw中,记录的是16 片芯片的厚度. 规定平均厚度为 1000 A, 已知标准差 为32A. 试检验此批芯片的平均厚度为 1000 A吗? 建立假设: H 0 : μ = 1000 ? H A : μ ≠ 1000 则在原假设成立时,应用抽样分布定理,应该有:Z= X ?μσ~ N (0,1)代入具体数值,得 x = 1018.63 ,Z=2.33,根据判断法则 2,当Z值太大或太小时,应 该拒绝原假设,而临界值为 z0.975 = 1.96 ,即应有判别 法则 z & z0.975 = 1.96 ,对于本例,应该拒绝原假设。97n判断法则1(根据p值)根据 P{| x |& 2.33} = 0.020 应该拒绝原假设.?显然,如果零假设为真时(镀膜厚度均值确实为1000A), 出现偏离达到和超过Z=2.33 (即Z&2.33或Z&-2.33)的概率 仅为2%,这是一种非常罕见情况。由于此可能性远远小于二 十分之一 (α =0.05),故在一次试验中不该出现。此值称为 p-value. 即“在原假设成立的条件下,出 现目前状况的可能性 或 此时拒绝原假设是犯 现目前状况的可能性”或“此时拒绝原假设是犯 第一类错误的概率”。 当p-value 很小时,应该拒绝原假设.通常,如果 p-value & 0.05, 则拒绝原假设.9849 另两个判断法则3.由 z & z0.975 = 1.96 可以反解出 X 的范围, 即 X 的临界值. 由 的临界值Z = X ?μσ=nX ? 1000 & 1.96 32 25X & 1000 + 1.96 ×4. 根据计算出的95%置信区间计算公式,而待检验的零假 设为 1000, 未落入上述置信区间, 因此应拒绝原假设。( x ± 1.9632 = 1000 + 12.54 =
32 X & 1000 ? 1.96 × = 1000 ? 12.54 = 987.46 25σn) = (1018.63 ± 1.969932 ) = (4.31) 16双侧检验用 用MINITAB, 注意双侧检验: , 对 “备择” 选定 “不相等”单样本 Z: 厚度 mu = 1000 与 ≠ 1000 的检验 假定标准差 = 32 平均值 标准差 变量 N 平均值 厚度 16 .62标准误 8.0095% 置信区间 (34.31)Z P 2.33 0.02010050 双侧检验101假设检验的p值与置信区间方法之间的比较假设检验法中的P值P-value重点在于此抽样结果有多么的反常。置信区间法重点在于估计总体参数,看检验标准的是否落入得出的置信区间 之内。检验法中的检验统计量所构建的置信区间适用于任何标准,而与假设检验法相应的检验统计 量可能因为显著性水平的变化而需要重新计算。 根据基本假定(例如已知或未知σ)选定不同的统计量(单样本Z或单样 本T)。其基本结果几乎是一致的。10251 对比流程图比较工程问题陈述 明确或具体规定 比较陈述的主要内容 ?产品或过程特点 ?产品或过程衡量项/单位 ?摘要统计量 ? 位置――平均值、中位数、比率 ? 散布――方差、标准差、IQR ?比较的类型 ? 单样本对标准 ? 一对一 多重比较 较 ? 多 ?比较的方向 ? 单侧 ? 双侧 ?样本量 ?α 风险 构建检验统计量 检查独立性 检查是否为正态分布 ? 如果不独立,仅报告估计的参数 和相应的图表。 ? 如果非正态,变换数据 ? 若不能变成正态,使用非参数方法 ? 将观测的检验统计量与检验统 计量的临界值进行对比 ? 将p-值与给定风险比较。 ? 将摘要计量的观测值与摘要统 计量的临界值进行对比 ? 根据检验的标准值或0是否落 入 (1- α)%置信区间构建比较问题的统计陈述 ?零假设 ?对立假设绝 法 利用样本证据拒绝或无法 利 样本 拒绝零假设撰写对比陈述结论103检验正态性由于我们的各项判断都强烈依赖于正态分布的性质,因 由于我们的各项判断都强烈依赖于正态分布的性质 因 此要求数据必须满足正态性条件。中心极限定理虽然说, 当数据样本量n=30以上,样本平均值可以近似可以看成正 态分布,但那时误差太大,结论不足为凭。因此,不论样 本量多大,都先要检验原始分布是否为正态分布。 可以用MINITAB对正态性假定进行检验(统计-基本统计-正 态性检验) 。该问题的假设是: H0:数据呈正态分布。 HA:数据非正态分布。10452 校验正态性强度 的概率图正态99 95 90 80 702150 均值 标准差 291.0 N 25 AD 0.181 P 值 0.904检查P值百分比60 50 40 30 20 10 511500175020002250 强度250027503000正态分布的数据将落在直线上并有一个较高的P值。105用来实现正态性的转换我们所进行的检验假设数据呈正态分布。 常常有这样的可能,对非正态数据进行转换,可 以得到正态分布。例如 虽然有多种转换方式,一般使用Box-Cox变换方法。? yλ , λ ≠ 0 y =? ?ln y, λ = 0*MINITAB可以提供指导,说明如何选用变换,其具体方 式是:使用“统计 C控制图 C Box Cox 变换”项下的 “Box-Cox变换”程序,对于数据“BS切削量.mtw”, 得到下图:10653 Box-Cox变换红线内的任一Lambda皆可107Box-Cox变换应用例题:BS收益.mtw,希望检验该过程是否有一个 例题 BS收益 mtw 希望检验该过程是否有 个 等于400的平均收益值。 α 风险 = 0.05.H 0 : μ = 400 ? H A : μ ≠ 400选择Box-Cox变换中 λ = 0,即要取自然对数LnY 。然后用单样本T检验 mu = 5.99146 与 ≠ 5.99146 的检验 N 25 平均值 标准误 0.245108变量 LnY平均值 标准差 6.050 1.22495% 置信区间 (5.544, 6.555)T P 0.24 0.81454 独立性? 另一个构成我们所讨论检验之基础的假设是,我们所采 另 个构成我们所讨论检验之基础的假设是,我们所采 集的数据是取自某一共同总体的随机独立样本。 ? 如果这些数据不是独立的,那么样本平均值的方差可能 不等于该总体的方差除以样本量 (σ2/n)。 如果我们发现数据不是独立的,我们建议仅能使用图 表及使用点估计值( point estimates )。不要计算置 信上下限,或进行假设检验。 信上下限 或进行假设检验 如果抽样真的是随机抽样,则数据应该是独立的。如果 发现数据不是独立的,则整个收集数据过程可能受到某 种特殊原因的干扰。把这种原因找出来,会对解决问题 大有帮助。109独立性游程(链)检验记 r 为游程(RUN)总个数,++++ - - ++ - - - + - - - H 0 : 数据是相互独立的 ? H A : 数据不独立当样本量不超过40 时,用“Run Chart”求出r,查表10确 定上下临界值 r L , r U 。当 r ≤ rL或r ≥ rU 时,拒绝原假设。 当样本量超过40时,先求出中位数,再以中位数为界,用 “游程检验(Run Test)”求出游程总数,并用正态近似法 计算出p-value,当p-value小于 α 时,拒绝原假设。 练习:BS芯片镀膜;BS切削量11055 假设检验概念要点1. 1 基本思想:零假设及备择假设的选定 2. “拒绝”是有说服力的;“接受”只是“不能拒 绝”而已, 因而是没有说服力的。 3. 在不增大样本量的情况下,只改变拒绝域可以减 少犯两类错误 α或β之一,而不能同时减小它们。 4. 选定α及β应根据实际问题决定,但对显著性检 4 选定α及β应根据实际问题决定 但对显著性检 验问题通常选定α=0.05,对β无法限定. 只在必要 时才对样本量 n 及α和β加以计算.111样本量问题f(决策错误的风险 总体标准差 拟检查的差异) n = f(决策错误的风险,总体标准差,拟检查的差异)。 如果希望降低犯错误的风险(↓), 那么必须扩大样本量(↑)。 随着母体变异性的增大(↑), 样本量增大(↑)。 随着拟检查之差异的变小(↓), 样本量增加(↑)。 同时,在选择样本量时,我们还必须考虑如下内容: 材料的成本。进行抽样的成本。实用性。样本的代表性。11256 样本量问题单边样本规模公式: 双边样本规模公式:n = Zα + Z β(? n = ? Zα + Z β ? ? 2 ? ? 2 ? ? Δ ??σ 2 ? 2 ? ? 2 2 ? ?σ ?)?Δ ?2实际上 Δ 常用估计到的差异带入(预检验得到的均值) ? 如果不知道 σ,我们可以用拟检查的差异与标准差之比。 ? 图表中的Y轴是比率 Δ/σ。 MINITAB中用“统计-功效与样本量”来计算各种检验问 题所需的样本量,如1-Z。1-T,2-T,1-P,2-P,DOE等113样本量问题μ 1 ? μ0= Δ 如果Ho 为真: 样本均值的分布: μ0 = 2000 n = 251?β如果 H A 为真: 样本均值的分布: μ1 = 2150 n = 25βαα = 0.05时的临界值 (2098.7) 无法拒绝 HO114拒绝H O57 样本量问题2.2d e l t a t o s i1.0 1.2 1.4 1.6 1.8 2.0Delta Function Target Ratio:1g m a0.6 0.8r a t i o0.0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 0.2 0.4Sample Size Alpha = 0.05, Beta = 0.05, N = 13图表中的Y轴是比率 Δ/σ。当要分辨的差异小于标准差之四 分之三时,样本量将急剧增长。115μ1-std 1-sampleZσ2 σ的 CI1-Variancep1-proportionmedianNP-1-sign NP-1-Signed Rank Wilcoxonσ 已知1-sampleTσ 未知1-1 2-sampleTV2 σ 12 = σ 22 variancesF-test ( Normal) Levene’s test(任意分布)2-proportionNPMann-Whitney2 σ 12 ≠ σ 2multiple ANOVA l i l F-test ( σ 12 = σ 22 = ... = σ k2 )%WelchsANOVA-等 差 等方差Chi-SqrTest Chi S T列联表Tables-Cross Tabulation (原始数据)2 variancesBartlett (Normal)NPNP Kruskal Wallis NPMood Medianα=0.01Levene’s test(任意分布) 116Tables-Chi-sq Test(摘要数据)58 两总体均值比较例:两种真空水泵最小压力平均值是否相等。 例:两种真空水泵最小压力平均值是否相等H 0 : μ1 = μ2 ? H A : μ1 ≠ μ2进行两总体均值相等性检验前要验证的前提条件:1. 两组数据都是独立的 2. 两组数据都是正态分布的 3. 两总体的方差是相等的,即 3 两总体的方差是相等的 即A. B. C. D. 条件3是必须的; 这里要求的是总体方差; 此检验具体操作下面再介绍; 此条件不满足也有近似方法。1172 σ 12 = σ 2双总体均值 t 检验H 0 : μ1 ? μ 2 = 0 ? H A : μ1 ? μ 2 ≠ 0基本公式t= ( X ? Y ) ? ( μ1 ? μ 2 ) ? T (n + m ? 2) 1 1 Sp + n m2 Sp = 2 (n ? 1) S12 + (m ? 1) S 2 n+m?2其中当方差相等性满足时,选定双样本t检验; 否则只能是近似双样本t检验11859 成对数据比较 (Paired Data)比较两种汽油添加剂的效果. 比较两台仪器测试测试10块矿石含二氧化锰含量. 成对比较法以配对差为样本,优于非配对分析的 主要优点在于,减少了实验中的变异性或“噪 声”。这些噪声会掩盖真正的差异. 事先尽量设计成配对的数据, 这样容易检查出差别. 配对的数据, 若误认为是 1-1 检验,则不易检查出差别. 本来是非配对样本,不得任意组对。这也将导致错误。119两样本方差比较对两个正常分布之母体的方差进行对比时,我们采用其比率而不 是差。 是差 针对以下检验:2 H 0 :σ 1 = σ 2 2 2 H A :σ 1 ≠ σ 2 2在零假设下,样本方差的比率构成F统计量,即为F分布。拒绝域为双侧。 为了考虑问题方便,我们总让分子取方差中的大者。 拒绝域为 F & F1?α ( n1 ? 1, n2 ? 1)2s12 F = 2 ~ F (n1 ? 1, n2 ? 1) s212060 F 检验MINITAB提供 种方便的方法,检验两样本方差(或 MINITAB提供一种方便的方法,检验两样本方差(或 标准差)是否来自方差相等的总体。如果两样本的 数据均为“正态”,则采用F检验。否则,采用 Levene检验。 打开PUMP.mtw ,我们检验两种型号真空水泵最小 压力的方差,看它们是否来自方差相等的总体。 F检与Levene检验的选择与比较。对于正态分布数 据,两个方法都可以用,但F检验功效更高(即犯第 II类错误更小,或容易检查出两总体方差的差别)。1216.3 ANOVA与多重比较问题例 多总体均值 较 由于温度影响产品得率 在 种温度 例:多总体均值比较:由于温度影响产品得率,在4种温度 下各进行5次试验,要判断温度对于得率是否有显著影响。X1 jX2jX3jX1X2XX3∑∑ ( Xi =1 j =1pmij? X )2代表总离差平方和 代表误差平方和 代表组间离差平方和122∑∑ ( Xpm∑∑ ( Xi =1 j =1i =1 j =1 p mij? X i )2i? X )261 离差平方和的分解平方和的分解公式假设Xi =X ij ~ N ( μi , σ 2 ), i = 1,... p, j = 1,...m1 m ∑ X ij m j =1X =1 p 1 p m ∑ X i = pm ∑∑ X ij p i=1 i =1 j =1p m p m则 即 自由度为∑∑ ( Xi =1 j =1pmij? X ) 2 = ∑∑ ( X ij ? X i ) 2 + ∑∑ ( X i ? X ) 2i =1 j =1 i =1 j =1SST = SS E + SS An ? 1 = (n ? p ) + ( p ? 1)123这里n = pmX11X12X13X14X21X22X23X24∑X ij Xi6 69 6 3 9 -2 4 1 1 85 6 -1 1 -2 4 -3 3 9 84 6 -2 4 -2 4 -4 4 16 88 10 -2 4 2 4 0 0 811 10 1 1 2 4 3 9 89 10 -1 1 2 4 1 1 812 10 2 4 2 4 4 16 8 56 SST 32 SS A 24X ij- X i 0( X ij ? X i ) 2 0Xi ? X( X i ? X )2 4SS E-2X ij ? X( X ij ? X ) 2-2 2 4 8X12462 单因子ANOVA分析要检验的假设是:H 0 : μ1 = μ2 =ANOVA_单因子.mtw 单因子方差分析: 得率 与 温度 来源 自由度 SS MS F P 温度 3 84.15 28.05 7.96 0.002 误差 16 56.40 3.52 合计 19 140.55= μk ? H A : 至少一对μi ≠ μ j 至少 对对于ANOVA的三项条件(独立、正态、各组方差相等) 的验证由于通常样本量都太小,常换成残差的验证。125多重比较分析Tukey 95% 同时置信区间 温度水平间的所有配对比较 单组置信水平 = 98.87% 温度 = 60 减自: 温度 下限 中心 上限 65 -0.401 3.000 6.401 70 1.399 4.800 8.201 75 -3.401 0.000 3.401 温度 = 65 减自: 下限 中心 上限 温度 70 -1.601 1.800 5.201 75 -6.401 -3.000 0.401 温度 = 70 减自: 温度 下限 中心 上限 75 -8.201 -4.800 -1.399126得率得率 的箱线图97 96 95 94 93 92 91 90 89 88 60 65 温度 70 7563 多重比较分析Fisher 95% 两水平差值置信区间 温度 水平间的所有配对比较 同时置信水平 = 81.11% 温度 = 60 减自: 下限 中心 上限 温度 65 0.483 3.000 5.517 70 2.283 4.800 7.317 75 -2.517 0.000 2.517 温度 = 65 减自: 下限 中心 上限 温度 70 -0.717 1.800 4.317 75 -5.517 -3.000 -0.483 温度 = 70 减自: 温度 下限 中心 上限 75 -7.317 -4.800 -2.283127得率得率 的箱线图97 96 95 94 93 92 91 90 89 88 60 65 温度 70 756.2.4 拟合优度检验 (Fitting Distribution) 1. 1 卡方分布的定义与性质 2. 离散型分布参数已知的卡方检验 3. 离散型分布参数未知的卡方检验12864 6.2.4 拟合优度检验若 令(Fitting Distribution)1.卡方(Chi-Square)分布定义: 1 卡方(Chi S )分布定义X i ~ N (0,1), i=1,2,…且相互独立,2 2 Q = X 12 + X 2 + ... + X n称 Q ~ χ 2 ( n) 方分布。,即Q服从自由度为n的卡 即Q服从自由度为 的卡1291卡方(Chi-Square)分布2 性质:A. χ (n) 的平均值为n,方差为2n. B. 若 X ~ χ 2 (n) ,Y ~ χ 2 (m) ,且二者相互独立, 则2X + Y ~ χ 2 ( n + m)χ 2 (5)χ 2 (10)13065 2 离散型分布参数已知的卡方检验例:在五选一的500道考题中,答案是A、B、C、D、E的 分别为 80,90,125,100,105。 试判断,可以认为选择5个字母的可能性是相同的吗? 1 1 对某个i成立 H 0 : pi = ? H A : pi ≠5 5从“统计-表格-卡方拟合优度检验(单变量)”入口, 设定均匀分布即可。检验类别 观测 80 A B 90 C 125 D 110 E 95 比率 0.2 0.2 0.2 0.2 0.2 期望 100 100 100 100 100 对卡方的贡献 4.00 1.00 6.25 1.00 0.25131N 自由度 卡方 P 值 500 4 12.5 0.0142 离散型分布参数已知的卡方检验对于离散型分布,当参数已知时,可以使用 对于离散型分布 当参数已知时 可以使用 K.Pearson的卡方检验:设此随机变量可能取k个不同之值(或不同的组), 假设落入每个组的概率分别为已知数值。对此随机变 量观测了n次,分别有ni 次落入第 i 组。试检验,这 些数据能认为是来自这个分布吗?H 0 : pi = pi 0 ? H A : pi ≠ pi 0这里 pi 0 均为已知数。13266 2 离散型分布参数已知的卡方检验K.Pearson定理: K Pearson定理:当n足够大时,(Oi ? Ei ) 2 Q=∑ ~ χ 2 (k ? 1) Ei i =1k这里 Oi 代表第 i 组的观测值个数, 这里 Ei 代表第 i 组的理论值个数, k代表组数. Ei = npi 0 容易得知: Q越大表示数据越偏离H0的假定. 拒绝域应取为: 2Q & χ 1?α (k ? 1)1332 离散型分布参数已知的卡方检验例原来市场上, 品牌A、B及C各占有份额0.3,0.5 0.2。 现在调查结果,三种品牌购买量分别为: 48,98,54. 现在调查结果 三种品牌购买量分别为 48 98 54 试问市场状况有变化吗?H 0 : pi = pi 0 ? H A : pi ≠ pi 0观测 48 98 54对某个i成立从“统计-表格-卡方拟合优度检验(单变量)”入口,指定分布即可。 检验类别 A B C N 200 比率 期望 对卡方的贡献 0.3 60 2.40 0.5 0 5 100 0.04 0 04 0.2 40 4.90 卡方 7.34 P值 0.025自由度 2说明C份额有明显降低, A份额有明显升高,B几乎未变.13467 Poisson 分布的估计与检验例 100天内每天检查10000支二极管,记录不合格数 (见“TB_二极管不合格数.mtw”)。 1)按Poisson分布估计其Poisson率。 2)可以认为其Poisson率为2吗? 从“统计-基本统计量-单样本Poisson率”入口,输入“样 本”及“频数”二列,就可以估计出其Poisson率及CI。变量 二极管不合格数 合计出现数 199 N 100 出现率 1.99000 95% 置信区间 (1.753)在本窗口中检验“Poisson率”是否比 2.24 小?。比率检验 = 2.24 与比率 & 2.24 变量 合计出现数 N 100 二极管不合格数 199135出现率 1.9900095% 置信区间 2.23816精确 P 值 0.0496.4 列联表与卡方检验假设有两个因子A和B。分别取a和b个水平。 假设有两个因子A和B 分别取a和b个水平 记出现Ai Bj 搭配这样结果的频数为Oij。将这 些数据排成下列表格(见下页)。 要讨论的问题是: A,B两个因子间是相互独立的吗?或问,A 对B 有影响吗? H0:AB间相互独立。 Ha:AB间不相互独立。13668 6.4.1列联表的概念A1 A2 … Aa Oa1 O.1 Oa2 O.2137B1 O11 O21B2 O12 O22…Bb O1b O2b Oab 0.bO1. O2. Oa. n6.4.1列联表:4格表的统计分析最简单和最常用的列联表是2行2列的 4 格表 最简单和最常用的列联表是2行2列的“4 格表” 随机调查了2000人, 询问他们是否吸烟及咳嗽。得 下表:不咳 不吸烟 吸烟
咳 100 100问:吸烟与咳嗽有关系吗? 或问:吸烟者与不吸烟者患咳嗽的比率相同吗?13869 6.4.1列联表:4格表的统计分析不咳 不吸
吸烟 700 720 总和
20 0.36 -20 20 0.9 100 120 100 80 200 咳 0.06 -20 0.04 20 0.1 总和
800 0.4 04 20001396.4.1列联表:4格表的统计分析代入具体数值计算可得:Q= (1100 ? 0 ? 120) 2 (700 ? 720) 2 (100 ? 80) 2 + + +
80=0.3 +0.0 =9.591它比临界值3.841大,因此应拒绝H0。 可以算出p-value为0.0026,结论相同。 总之,吸烟确实与咳嗽有关,或可以断言:吸烟者与不 吸烟者患咳嗽的比率是不相同的。14070 6.4.2一般列联表的统计分析一般列联表的统计分析步骤与4格表的统计分析完 般列联表的统计分析步骤与4格表的统计分析完 全相同,只是行数列数增多而已. 设A因子有a个水平, B因子有b个水平 H0:A与B相互独立; Ha:A与B不独立; 在H0下,统计量及其分布为:Q=∑i =1 k(Oi ? E i ) 2 ~ χ 2 (( a ? 1)( b ? 1)) Ei当Q & χ12?α ((a ? 1)(b ? 1))141时拒绝H06.4.2 多总体比率检验实例给外商办理营业执照应在10个工作日内完成。 各城市间的及时率有显著差异吗?数据文件:及时率.MTW 数据文件 及时率 MTW 结论:三城市的及时率有显著差异,P 值 = 0.002 注意:在MTB卡方检验中输入的是“及时”“ 不及 时”2列,且不含“总和”行。14271 6.4.2 一般列联表的统计分析例汽车选型分析。 汽车选型分析 在cartype.mtw中,记录了303辆汽车的销售记 录。车型分“家用”、“工作”和“运动”三 种,顾客资料包括性别、年龄、国别(美、日、 欧)和婚否4项顾客状况。要分析选购车型与 这4项顾客状况是否有关。 结论:选购“车型”与性别无关,与年龄、婚 否和国别显著相关。选购“尺寸”与性别、年 龄、婚否无关,只与国别显著相关。1436.4.3高维列联表与Simpson悖论经卡方检验,车间 B 优于车间 A。对两种产品分别进行卡方检验,车间 A 都优于车间 B两种产品不良率不同,不能用求和方法处理。14472 6.4.3 Simpson悖论原例Simpson悖论(此例仅为数学悖论而非统计悖论) 美国Florida州年被判死刑情况结论:白人凶手被判死刑比率高于黑人凶手1456.4.3 Simpson悖论原例按按被害人分类,不论被害人是白人或黑人,黑 人凶手被判死刑比率都高于白人。 人凶手被判死刑比率都高于白人 不区分被害人则总的数据却是:白人凶手被判死刑 比率高于黑人。 被害人为白人时判死刑比率高,而白人凶手杀害白 人的比率高:132/(132+9)=0.93614673 6.4.3 高维列联表的统计分析M大学研究生录取结果全校总和的性别比较录取人数 未录取人数 926 985 报名人数 录取率 .9 733 428男生 女生用列联表检验,男生录取率显著高于女生此结论对吗??1476.4.3 高维列联表的统计分析再仔细分析更进 步数据 再仔细分析更进一步数据 5 个学院的报名及录取状况数据文件:学生录取.MTW 这属于 3维列联表。学院是最外“层”。 结论:各学院男女录取比率均无显著差异。14874 6.4.3 高维列联表的统计分析将学院作为外层,各学院男女生录取比率均无显著差异。1496.4.3 高维列联表的统计分析按学院列出报名人数及录取率如下:“女生总录取率低”的原因是男女生报名人数的分布不 同:男生在录取率高的学院考生比率高;女生在录取率 高的学院考生比率很低。15075 6.5非参数检验6.5.1 6 5 1 非参数检验概念 6.5.2 符号检验法(Sign Test) 6.5.3 游程检验(Run Test ) 6.5.4 双样本曼-惠特尼(Mann-Whitney)检验 6.5.5 单样本威尔科克森秩和检验 (WilcoxonSigned Rank Test) Wallis)检验6.5.6 多样本克鲁斯卡尔-沃利斯 ( Kruskal6.5.7 多样本穆德(Mood)中位数检验1516.5.1 非参数检验概念非参数检验概念:非参数假设检验:问题本身就不是关于参数的(如检验分布正态 性、两总体分布相同等)。 非参数检验方法:问题仍是参数问题(中位数相等性检验等), 但方法是非参数的,即常常只是用“符号”(Sign)、“秩” (Rank)及“游程”(Run) 3 种工具。使用条件及适用范围:1)若数据非正态,则常用的 Z,t,F及卡方检验都不能使用。 1)若数据非正态 则常用的 Z t F及卡方检验都不能使用 为获得检验结果,只能使用非参数方法。 2)非参数方法简便易行,但同样问题、同组数据,非参数检验 效果不如参数方法(即检验功效稍小或第二类错误概率大)。15276 6.5.2 符号检验法2. 符号检验法:1-Sample Si t t 2 符号检验法 1 S l Sign testH 0 : p+ = p? = 0.5 ? H A : p+ ≠ p?记 n+ 及 n? 分别为正负号的个数, n = n+ + n? 令: S = min{n+ , n? } 根据n及 查表8求出下界 根据 及α 查表 求出下界 Sα 若 S ≤ Sα ,则拒绝原假设。符号检验法与单比率检验(P=0.5?)是一回事,只是表现 形式不同。1536.5.2 符号检验法应用1)中位数检验:例P286房价,P287产量。 1)中位数检验:例P286房价 P287产量 2)控制图中,上升(下降)次数正常吗? 3)一个序列有上升(或下降)的趋势吗? (将序列折半[奇数时删去中间项],前后两半比较之) 4)两种治疗方法哪种更好?M好 N好 N不好 200 52154M不好 28 12077 6.5.4 秩和检验(Sum of Rank)4.秩和检验:Mann Whitney 4 秩和检验:Mann-Whitney Test12, 13, 14, 14, 15, 16, 19, 19, 19, 21, 23 秩 1 2 3.5 3.5 5 6 8 8 8 10 11 两总体均值(换成中位数)的相等性检验, 用“秩和法”.H 0 : η1 = η2 ? H A : η1 ≠ η2将两组数据合并排序、赋值,计算出样本量较小者的秩和T, 将两组数据合并排序 赋值 计算出样本量较小者的秩和T 查临界值表9得到T1,T2。 若 T ≤ T1 或 T ≥ T2 ,则拒绝原假设。 当样本量之一超过10,则可以使用近似正态检验法。1556.5.5 符号秩检验(1 Sample 5. 5 符号秩(1-Sample Wilcoxon Signed Rank Test)H 0 : η = η0 ? H A : η ≠ η0x X-14 ABS Rank R k -3 35η 0 =144 46.5 6511 12 12 13 16 18 18 19 20 23 25 29-2 23-2 23-1 112 234 46.5 655 586 699 91011 111115 1512将样本值与中位数之差的绝对值排序、赋值, 对正负号分 别求秩和,用秩和检验法判断之。T=12, 拒绝原假设.15678 6.5.6 Kruskal-Wallis 检验H 0 : 各组均值相等 ? H A : 各组均值不全相等对于K组任意分布(不一定是正态)的样本,将其样本按 从小到大的顺序排好,记各组的样本量为 ni ,各组的秩 和为 Ri ,总样本量为N,考虑下列统计量? 12 ? ? k Ri2 ? H =? ? ?∑ ? ? 3( N + 1) ? N ( N + 1) ? ? i =1 ni ?其含义是各组秩和的“方差”。当各组样本量皆大于5时, 近似有: H ~ χ 2 ( k ? 1)当 H & χ12?α(k ? 1) 时,拒绝原假设。1576.5.7 Mood 中位数检验原理:先求出全部数据的中位数M,再在各样本内对于 “比M大”、“比M小”的数据记录个数,构成列联表。 例题:Casting.mtw 对A-E共6个车间轮箍断裂强度比较 中位数检验相当于符号 检验,数据量要求要大, 但稳健性好; Kruskal-Wallis 检验相当 于符号秩检验,数据量 可以很小,但稳健性差。15879 补充内容简介一. 变异源分析( Source of Variation, SOV)1. 2. 3. 4. 目的,必要性,与DOE的比较。 使用步骤; SOV图形方法:Multi-Vari-Chart SOV数值方法:因子的交叉与嵌套,固定效应与随 机效应,方差分量公式与ANOVA。二. 测量系统分析(第5章第4节)1. 测量系统的评估标准。 2. 测量系统分析的步骤,传统方法与一般方法。159一. 变异源分析(SOV)1. 目的:将实际工作中的过程中的全部变异(Variation) 分解为若干有意义的分量,从而确认出对变异 有最大贡献的分量,以便缩小变异。SOV是拍“快照”,不改变现有一切设置条件。只进行观 察,然后分析,并不提供解决问题办法。 DOE是为了寻找新的设置,先安排新条件下的试验以收集 新数据,获得改进工作的信息,提供解决问题办法。SOV 与 DOE不同,SOV常在早期分析阶段进行。16080 1. 目的:总变异的分解(见p176页): σ 2Total = σ 2 proocess + σ 2 MS1)先进行测量系统分析若测量系统不合格――分析测量系统σ 2 MS = σ 2 RPD + ... + σ 2 error2)若测量系统合格――分析SOVσ 2 proocess = σ 2 time + σ 2 PT 1 + σ 2 PT 2 + ... + σ 2 Error1612. 变异产生的原因1)元件内部差异(within-Part)最基本单元内部间的差异2)元件与元件间差异( Part-to-Part)批与批, 芯片与芯片,板与板, 生产线与生产线 工人与工人间, 工人与工人间 供应商与供应商3)时间差异(Temporal):周一至周五, 小时间,白班与夜班,四季差异16281 3.变异源分析(SOV)步骤:3. 1 选定因子及水平;树状图(Tree Diagram) 定 子 水平;树状图 g 3. 2. 收集数据. 3. 3. 定性分析――图形分析(Multi-Vari Chart) 3. 4. 定量分析――方差分量表及Pareto Chart。 3. 5. 变差得到反映了吗?主要变异原因找到了吗? (若没找到, 回到3.1 ) 3. 6. 结论与建议。1633.1. 选定因子及水平;以树状图(Tree Diagram)为标志 Diagram)为标志.1)要找出可能产生变异的关键来源,尽量列出;(供应商, 原材料, 季节,不同的生产条件等)2)至少要达到历史变异的70%-80%. 3)每一个因子至少 3个水平以上. 4)误差不算“因子”,但估计误差(条件完全相 同的重复)至少取 2个以上观测值.16482 3. 2. 收集数据1) 建立数据收集表格 建立数据收集表格. 2) 历史数据仅供参考,要有目的地收集新数据. 3) 按计划收集, 不能全凭随机抽样. 4) 按指定时间间隔, 连续抽取. 5) 按指定位置进行测量, 重复测量不是简单地进 行若干次测量,而应考虑可能的误差.1653. 3. 定性分析――图形分析多变异图(Multi-Vari 多变异图(Multi Vari Chart) 是主要工具 是主要工具. 从SATA-Quality Tools- Multi-Vari Chart入口 自下而上填写因子. 误差不算“因子”, 不要填写. 注意从图形中分析变异产生来源. 练习:Sovex1~4 结论:多变异图显示直观,但缺少精确结论.16683 3. 4. 定量分析――方差分量表1) 因子间的交叉(Cross)与嵌套(Nested) ) 子 交 ( ) 嵌套( ) 2) 固定效应因子(Fixed Effect)与随机效应因子 (Random Effect) 注:SOV中的因子都考虑为随机效应. 3) 只有交叉的因子才有交互效应. 4) ANOVA仅限于交叉的固定效应的情况. 5) SOV的方差分量要另行计算.A)直接用ANOVA-Fully Nested ANOVA B)用一般线性模型ANOVA- General Linear Model1673. 5.变异源分析(SOV)例1车 车间在 产标准螺钉时的关键性指标是加 车工车间在生产标准螺钉时的关键性指标是加工 出的螺钉的直径. 我们从十几位工人中随机选取 3 个工人:M1,M2和M3. 让他们使用同一根钢条作原料, 每人都使用自己平 时所用的车床, 分别各自加工出 4 颗螺钉, 然后在 每颗螺钉的根部随机选取两个相互垂直的方向,分 别测出其直径. 共得出24个数据. 我们的问题是, 螺钉直径间的变异究竟是怎样产生 的? 其数据列于下表. 因子:工人和零件,二者关系是嵌套的.16884 3. 5 变异源分析(SOV)例1数据列表(SOV2C.mtw): 数据列表(SOV2C mtw):工人 A 测量 1 2 3 4 1 8.2 8.6 8.4 8.2 2 8.4 8.4 8.5 8.4 1 8.8 8.9 8.7 8.6 工人 B 2 8.9 8.6 8.6 8.7 1 8.1 8.3 8.1 8.2 工人 C 2 8.2 8.2 8.2 8.3从“统计-质量工具-多变异图”入口画图:1693. 5 变异源分析(SOV)例117085 3. 5 变异源分析(SOV)例1从统计 从统计-ANOVA-全嵌套入口,因子自上而下填写,即可得方 全嵌套入 ,因子自上而下填写,即可得方 差分量计算结果。方差分量 方差分量 来源 worker 0.001 screw 0.000 误差 0.000 合计 0.001 总和的 % 标准差 83.35 0.026 2.02 0.004 14.63 0.011 0.029从STAT-Quality Tools-Pareto Chart入口,用Chart Defects Table, 将Source放入 Label, 将 VarComp 放入 Frequencies , 即可得下列Pareto图.1713. 5 变异源分析(SOV)例1Pareto Chart of Source0.09 0.08 0.07 0.06 %per 0.05 0.04 0.03 0.02 0.01 0.00 Source Count Percent Cum % worker 0.069 83.1 83.1 Error 0.012 14.5 97.6 Other 0.002 2.4 100.0 0 40 20 60 Percent 100 8017286 3. 5 变异源分析(SOV)例1一般情况要用“一般线性模型”来计算。先要写出模型: 般情况要用 般线性模型 来计算。先要写出模型:嵌套型 交叉型 Y= A + B(A)+ C(A B) Y= A + B + A*B = A|B Y= A + B + C + A*B +A*C +B*C +A*B*C =A|B|C 先交叉后嵌套型 Y= A|B + C(A B)从Stat-ANOVA-General Linear Model入口。 从St t ANOVA G l Li M d l入口 在“Model”中填写模型。 在“Random”中选中随机效应因子(缺省为固定效应) 在“Results”中增加输出“Variance Component”。1733. 5 变异源分析(SOV)例2对于随机选取的 3个工人:M1,M2和M3,让他们使用 机 个 , 他 使 同一根钢条作原料,分别使用已选好并编了号的4台 车床,各自分别加工出 3 颗螺钉, 然后在每颗螺钉 的根部随机选取两个相互垂直的方向,别测出其直径, 共得出72个数据。 我们的问题是, 螺钉直径间的变异究竟是怎样产生的? 其数据列于文件SOV3n.mtw中。 因子:工人、车床和零件,前二者关系是交叉的, 后二者关系是嵌套的。 只能使用一般线性模型:Stat-ANOVA-General Linear Model17487 3. 5 变异源分析例2 图11753. 5 变异源分析例2图217688 3. 5 变异源分析(SOV)例2方差分量,使用调整的 方差分量 使用调整的 SS 来源 worker machine worker*machine parts(worker machine) 误差 估计值 0.39 0.08 0.000151773. 5 变异源分析(SOV)例217889 6.6 回归分析和相关分析6.6.1 相关分析的概念及方法。 6 6 1 相关分析的概念及方法 6.6.2 简单一元及多元线性回归模型。1)用最小二乘法估计统计线性模型的参数。 2)对线性回归模型进行统计分析。 3) 对线性回归模型进行残差诊断。6.6.3 多元线性回归(逐步回归、最佳子 集回归) 6.6.4 离散变量的Logistic回归1796.6.1 相关分析:相关系数样本相关系数定义r=∑ ( x ? x )( yi =1 i n 2 n i =1 ini? y) =iLxy Lxx Lyy∑ (x ? x) ? ∑ ( yi =1? y )2从“统计-基本统计-相关”入口 ,可得样本相关系数。增 加输出 显示 p 值 加输出“显示 p-值”就可以得到对相关系数的检验结果 为检验X与Y是否相关,记二者总体相关系数为ρH0 : ρ = 0 ? H A : ρ ≠ 0软件给出对此检验的p值,当p&0.05时,判X与Y相关。18090 6.6.1 相关分析:相关系数Scatterplot of y vs x3.501.50 150Scatterplot of y vs x3.251.253.00r=11.0 1.5 2.0 x 2.5 3.0y1.00r=-1y2.750.752.500.50 1.0 1.5 2.0 x 2.5 3.0Scatterplot of y vs x3.75 375Sca lo o yvsx tterp t f1 .751 .503.501 .253.25 y 3.00 2.75r=0.81 .00r=-0.8y0 .75 0 .502.501 .0 1 .5 2 .0 x 2 .5 3 .01.01.52.0 x2.53.01811816.6.1 相关分析:相关系数ca rp t f S tte lo o yvsx5 .0 4 .5 4 .0Sca rp to yvsx tte lo f2.52.01.53 .5 y 3 .0 2 .5 2 .0r=0.41.0r=-0.41.0 1.5 2.0 x 2.5 3 .0y0.50.01.0 1 .5 2.0 x 2 .5 3 .0lot Scatterp of r vsx2Scatterplot of y vs x2.5 2.01r=0y1.5 1.0 0.50r=0r-10.0 -0.5-2 1.0 1.5 2.0 x 2.5 3.0-1.0 1.0 1.5 2.0 x 2.5 3.018218291 1。相关分析:相关系数对于相关系数的理解: 若 X 与 Y 不 相关 若 X 与 Y 不线性相关 总体相关系数ρ为0 总体相关系数ρ为0注意:两个变量高度相关并不能认为其中某个变量 是另一个变量变化的原因或潜在原因。他们可能同 时以另 个变量为变化的根本原因。 时以另一个变量为变化的根本原因。 若两个变量不相关,则可以肯定其中某个变量不 可能是另一个变量变化的原因或潜在原因。1831836.6.1 相关分析:相关系数同时输入多个变量可以求出散点矩阵及相关系数矩阵。分析水泥成分x1-x4 间的关系 数据为:RegHald.mtw 相关: x1, x2, x3, x4 x1 x2 0.229 0.453 x2 x3x3 -0.824 -0.139 0.001 0.650 x4 -0.245 -0.973 0.419 0.000 0.030 0.92418492 6.6.2 回归分析要点1. 用最小二乘法建立回归方程注意回归系数是有量纲的。2. 回归方程的统计分析1)回归总效果的显著性分析:ANOVA表2)回归总效果的度量:R-sq,R-sq(adj),s 3)各回归系数的显著性检验 4)回归方程在预测上的应用 A)预测值的点估计 B)预测值的均值的区间估计(95%CI) C)预测值的单个观测值的区间估计(95%PI)1856.6.2 回归分析要点3. 3 残差分析1)残差vs观测值顺序:重点考查是否有趋势 2)残差vs响应变量预测值: 重点考查是否有非齐性(喇叭口状) 3)残差的正态性 4)残差vs自变量值 重点考查是否有弯曲18693 1 简单线性模型模型 y是响应变量(是随机变量)。 x是单因子或模型预报变量(是可控变量)。 β0 和 β1是回归系数。 其中是β0 截距, β1是斜率Error是试验误差或噪音,包括: E 是试验误差或噪音 包括 *不可控因子的重复误差或纯误差。 * 失拟误差(Lack of Fit)。1871.最小二乘法最小二乘法决定了估计回归模型参数的方法, 使下述平方和最小:Q =∑ (yi =1ni? ? yi )2 =∑ (yi =1ni? β 0 ? β 1 x i ) 2 → minQ 称作误差的平方和。模型的参数估计公式为:? β1 = ∑ ( xi ? x )( yi ? y )∑ ( xi ? x )2=∑ x y ? nxy ∑ x ? nxi i 2 i? ? β 0 = y ? β1 x数据文件:BS温度与产量.mtw18894 1.最小二乘法(先画x-y散点图,再拟合最佳直线)Plot 得回归线方程 STAT Regression Fitted STAT-Regression-Fitted Line Plot,得回归线方程Fitted Line Ploty = 60.00 + 5.000 x 200 175 150 y 125 100 75 50 0 5 10 x 15 20 25S R-Sq R-Sq(adj) 13.% 89.1%1891.最小二乘法回归分析:产量 与 温度(用MINITAB计算,拟合最佳直线)回归方程为 产量 = 60.00 + 5.000 温度 S = 13.8293 R-Sq = 90.3% R-Sq(调整) = 89.1% 方差分析 来源 自由度 SS 回归 1 14200 误差 8 1530 合计 9 15730 MS .2 F P 74.25 0.000回归系数表示, 温度每增加1度,平均说来, 产量会增加5 Kg19095 1. 如何量猪的体重?直接上磅称很费事,且难量准确身长肚围数据文件:pig.mtw1911. 最小二乘法例2. 例2 猪的体重公式身长: L(cm);肚围:C (cm);体重: W (Kg) 关系式: W = β 0 + β1 L + β 2C一般的2自变量线性方程为:y = β 0 + β1 x1 + β 2 x2一般的m个自变量线性方程为:y = β 0 + β1 x1 + ... + β m xm19296 1. 最小二乘法回归方程为 0 445 W = - 14 7 + 0.529 L + 0.445 C 14.7 0 529 自变量 系数 系数标准误 T P 常量 -14.705 4.718 -3.12 0.010 0.4 5.07 0.000 L 0.8 2.97 0.013 C S = 2.21415 R-Sq = 98.5% R-Sq(调整) = 98.3% 方差分析 来源 自由度 回归 2 残差误差 11 合计 13 SS .9 3677.7193MS .9F P 369.59 0.0002. 问题分析和解释1. 1 X对Y的影响多大?(工程问题)输入因子X对效应Y是否有统计的显著影响?(统计问题)2. 回归模型效果如何?(工程问题)所有变差中,占多大比例可以被回归模型解释,多少被试验误差解 释?(统计问题)3. 模型的各参数估计的可靠性如何?(工程问题)最小二乘法估计的模型参数的检验及置信区间(统计问题)4. 未进行试验的点X处,对应的Y是多少?多大波动?(工程问题)我们能否预报特定X水平下的响应变量值及置信区间?(统计问题)19497 2.1 方差分析各项平方和的计算公式SSTotal = ∑ ( yi ? y )2 2 2? SS Model = ∑ ( yi ? y )? SS Error = ∑ ( yi ? yi )其中,yi 是 xi 点的观测响应。? ? 点处的预测响应。 ? yi = β 0 + β1 xi 是 xi 点处的预测响应y 是所有观测响应的均值。要检验的假设是:H 0 : 模型无效 ? H A : 模型有效195总离差平方和、回归平方和及残差平方和示意图yiy? yiyi平方后求和, 为残差平方和 平方后求和, 为总离差平方 和19698 2.1方差分析平方和分解公式 SSTotal = SS Model + SS Error对于自由度的分析,一般而言,如果n = 数据个数, p=包括截距在内的模型参数个数那么DFSSTotal = n ? 1DF SSModel = p ?1DF SSError = n ? p而且(n ? 1) = ( p ? 1) + (n ? p)DF SSTotal = DF197总之,自由度有SS Model + DFSS Error2.1 问题分析和解释在散点图下有分析报告,提供了拟合模型的相关信息。例1. 求温度与产量间回归方程回归方程为 产量 = 60.00 + 5.000 温度 S = 13.8293 R-Sq = 90.3% R-Sq(调整) = 89.1% 方差分析 SS 来源 自由度 回归 1 14200 误差 8 1530 合计 9 15730 MS .2 F P 74.25 0.00019899 2.1问题分析和解释例2. 例2 猪的体重公式W = - 14.7 + 0.529 L + 0.445 C方差分析 自由度 来源 回归 2 残差误差 11 合计 13SS .9 3677.7MS .9F P 369.59 0.0001992.1方差分析例1. 例1 求温度与产量间回归方程方差分析 SS 来源 自由度 回归 1 14200 误差 8 1530 合计 9 15730 MS .2 F P 74.25 0.000MS Model 14200 = = 74.25 MS Error 191.2 P-value=0.001&0.05 , 结论:模型有效. F=200100 2.1 方差分析例2. 猪的体重公式W = - 14.7 + 0.529 L + 0.445 C方差分析 来源 自由度 回归 2 残差误差 11 合计 13 SS .9 3677.7 MS .9 F P 369.59 0.000p p-value=0.000&0.05F=MS Model 1811.9 = = 369.59 MS Error 4.9结论:模型有效.2012.2拟合情况摘要表R2用于估计统计回归模型的拟合优度。例1. 求温度与产量间回归方程S =13.8293 R-Sq = 90.3% R-Sq(adj) = 89.1% 上表中R2=0.903,说明模型解释了观测响应的90.3%的误差。例2. 例2 猪的体重公式S = 2.214 R-Sq = 98.5% R-Sq(adj) = 98.3% 上表中R2=0.985,说明模型解释了观测响应的98.5%的变动。202101 2.2拟合情况摘要表R2R2 与相关系数的关系因为简单线性回归模型只有一个输入变量,所以R2与相关 系数直接相关 RSquare = (Correlation Coefficient ) 2 = R 2R衡量的是输入变量x和响应变量y之间的线性关系, 1、如果R接近0,说明x和y没有线性相关性。 2、如果R接近-1或+1,说明x和y有很强的相关性。 所以R2越大,说明模型拟合越好。 但是,不论增加一个自变量是否有意义, R2都会变大。2032.2拟合情况摘要表adjR2adjR2 R2并不是回归模型拟合优度的最好衡量。因为越多项加入模型, 则 R2越会增加。因此我们用adjR2对R2进行校准,以考虑模型的 总项数的影响。SS Error AdjR = 1 ?2(n ? p) (n ? 1)SSTotal或AdjR 2 = 1 ? (n ?1 )(1 ? R 2 ) n? p我们可以肯定 AdjR2≤R2,其用途是:两者越接近,模型拟合越好。204102 2.2拟合情况摘要表MSE及Sσ? y + 2s? yσ2的估计量就是MSE σ的估计量就是Sσ? y ? 2sσ观测值95%预测置信区间的? 粗略估计是:y ± 2 s2052.2拟合情况摘要表MSEANOVA表中ERROR行中的均方差项Mean Square Error特别重要 MSE=Q/(n-p) 是σ2的无偏估计(P是方程系数个数,含常数项) s = RMS = Sqrt(Mean Square Error) =Root Mean Square Error? s 越小,拟合越好。观测值95%预测粗略置信区间为: y ± 2 s 例1。求温度与产量间回归方程S = 13.829 R-Sq = 90.3%MS .2 191.2R-Sq(adj) = 89.1%P F 74.25 0.000来源 自由度 SS 14200 回归 1 误差 8 1530 合计 9 15730MSE上表中 s = 13.829 = 191.2206103 2.2拟合情况摘要表MSE例2. 例2 猪的体重公式 ? w = - 14.7 + 0.529 L + 0.445 C方差分析 来源 自由度 回归 2 残差误差 11 合计 13S = 2.214SS .9 3677.7MS .9F P 369.59 0.000MSER-Sq = 98.5%R-Sq(adj) = 98.3%s = 2.214 = 4.9? ? 猪的体重公式预测精度是:w ± 2 s = w ± 4.4kg2072.3回归系数的估计及检验参数估计是通过最小二乘法得出的,因此也是随机变量。 参数估计是通过最小二乘法得出的 因此也是随机变量 Std Error是最小二乘法得到的估计量的标准差. 考虑假设检验 问题: t Ratio列包含了模型的两个参数的检验 t 统计量Prob&|t|如小于0.05,则此参数确实不为0,否则此参数为0。不能仅依靠回归方程中系数大小来判断变量的显著性208104 2.3回归系数的估计及检验例1. 例1 求温度与产量间回归方程. y = β 0 + β1 x从“统计-回归-回归”入口系数 系数标准误 T 自变量 常量 60.000 9.226 6.50 温度 5.3 8.62 P 0.000 0.000H 0 : β1 = 0 ? H A : β1 ≠ 0T= 6 50 6.50 p= 0 000 0.000 拒绝 H0,即 即β1 ≠ 0即温度的效应是显著的.如果自变量只有一个,则此变量的显著性与模型 的显著性完全等价(p-值也完全相等)2092.3回归系数的估计及检验例2. 猪的体重公式W = β 0 + β1 L + β 2 CH 0 : β 1 = 0 ? H A : β1 ≠ 0T= 5.07系数 系数标准误 T P 自变量 4.718 -3.12 0.010 常量 -14.705 0.4 5.07 0.000 L 0.8 2.97 0.013 CCIofp= 0.000 拒绝 H 0 ,即 β1 ≠ 0 ? ± t (n ? p ) s ) = (0.5288 ± 2.18 * 0.1044) = (0.301,0.756) β1 = ( β1 1?α2H0 : β2 = 0 ? H A : β2 ≠ 0T= 2.97 p= 0.013 拒绝 H 02,即β2 ≠ 0CIof? β 2 = ( β 2 ± t1?α (n ? p ) s ) = (0.4454 ± 2.18 * 0.1498) = (0.119,0.772)210105 2.4 预测值及其置信区间例1. 求温度与产量间回归方程Fitted Line Ploty = 60.00 + 5.000 x 250Regression 95% C I 95% PI S R-Sq R-Sq(adj) 13.% 89.1%200150 y 100 50 0 5 10 x 15 20 252112.4预测值及其置信区间第 个置信区间是由于参数估计的不确定性导致的回归方程本身的波 第一个置信区间是由于参数估计的不确定性导致的回归方程本身的波 动范围。称为(Confidence Limit),简记为 95.0% CI 第二个置信区间是由于观测值偏离回归方程中心而导致的观测值的波 动范围。称为(Prediction Limit),简记为 95.0% PI STAT-Regression-Regression入口后, 在Option中指定自变量值, 要求输出:拟合值(Fit), 拟合值处的标准差(SE of Fit), 95%置信限(Confidence Limit) 95%预测限(Prediction Limit) 可得如下结果:212106 2.4预测值及其置信区间例1. 求温度与产量间回归方程.当温度为18度 时, 产量的预测值。新观测值 拟合值 拟合值标准误 95% 置信区间 95% 预测区间 1 150.00 4.95 (138.58, 161.42) (116.13, 183.87) 新观测值 温度 1 18.0预测值为 150 ( Kg)理论上讲:在18度这样温度下,产量平均值应在(138.58, 161.42) 之间 ,(95%把握)。 真正在18度这样温度下生产一次,其产量应在(116.13,183.87) 之间 ,(95%把握)。2132.4预测值及其置信区间例2. 猪的体重公式,求猪身长85cm 腰围90cm时,猪的 体重的预测值。 体重的预测值新观测值 拟合值 拟合值标准误 95% 置信区间 1 70.336 1.119 (67.873, 72.798) 新观测值的自变量值 C 新观测值 L 1 85.0 90.0 85 0 90 0 95% 预测区间 (64.875, 75.796)预测值为 70.3 (Kg) 理论上讲:这样体型的猪的体重平均值应在 (67.8,72.8) 之间 (95%把握). 随意抽取一猪,其体重应在 (64.8,75.8) 之间 (95%把握).214107 3 残差分析(残差分析的必要性)分别计算regression.mtw中的4组数据之回归方程.Regression PlotY1 = 3.00009 + 0. S = 1.23660 R-Sq = 66.7 % R-Sq(adj) = 62.9 %10 9 8 7Regression PlotY2 = 3.00091 + 0.5 X2 S = 1.23721 R-Sq = 66.6 % R-Sq(adj) = 62.9 %12Y1Y276 5 4 3 4 5 6 7 8 9 10 11 12 13 14Regression 95% PI2 4 5 6 7 8 9 10 11 12 13 14X1 Regression PlotY3 = 3.00245 + 0. R-Sq = 66.6 %X2Regression PlotY4 = 3.00173 + 0.S = 1.2357013 12 11 10S = 1.2363113 12 11 10R-Sq(adj) = 62.9 %R-Sq = 66.7 %R-Sq(adj) = 63.0 %Y4Y39 8 7 6 5 4 5 6 7 8 9 10 11 12 13 149 8 7 6 5 10 15 20X3X42153 残差分析(

我要回帖

更多关于 response什么意思 的文章

 

随机推荐