统计方法求助:小样本量多少才有统计学意义(n=3)用什么方法

卫生统计学方法
篇一:公卫必备 卫生统计学各种资料统计方法大汇总 一、两组或多组计量资料的比较 1.两组资料: 1)大样本资料或服从正态分布的小样本资料 (1)若方差齐性,则作成组t检验 (2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验 2.多组资料: 1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的(来自: 唯 才 教育 网:卫生统计学方法)方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。 2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。 二、分类资料的统计分析 1.单样本资料与总体比较 1)二分类资料: (1)小样本时:用二项分布进行确切概率法检验; (2)大样本时:用U检验。 2)多分类资料:用Pearson c2检验(又称拟合优度检验)。 2. 四格表资料 1)n&40并且所以理论数大于5,则用Pearson c2 2)n&40并且所以理论数大于1并且至少存在一个理论数&5,则用校正c2或用Fisher’s 确切概率法检验 3)n£40或存在理论数&1,则用Fisher’s 检验 3. 2×C表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验 2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验 3)行变量和列变量均为无序分类变量 (1)n&40并且理论数小于5的格子数&行列表中格子总数的25%,则用Pearson c2 (2)n£40或理论数小于5的格子数&行列表中格子总数的25%,则用Fisher’s 确切概率法检验 4. R×C表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验 2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH c2 3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析 4)列变量和行变量均为无序多分类变量, (1)n&40并且理论数小于5的格子数&行列表中格子总数的25%,则用Pearson c2 (2)n£40或理论数小于5的格子数&行列表中格子总数的25%,则用Fisher’s 确切概率法检验 三、Poisson分布资料1.单样本资料与总体比较: 1)观察值较小时:用确切概率法进行检验。 2)观察值较大时:用正态近似的U检验。 2.两个样本比较:用正态近似的U检验。 配对设计或随机区组设计四、两组或多组计量资料的比较 1.两组资料: 1)大样本资料或配对差值服从正态分布的小样本资料,作配对t检验 2)小样本并且差值呈偏态分布资料,则用Wilcoxon的符号配对秩检验 2.多组资料: 1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。 2)如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman的统计检验。如果Fredman的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用Wilcoxon的符号配对秩检验,但用Bonferroni方法校正P值等)进行两两比较。 五、分类资料的统计分析 1.四格表资料 1)b+c&40,则用McNemar配对c2检验或配对边际c2检验 2)b+c£40,则用二项分布确切概率法检验 2.C×C表资料: 1)配对比较:用McNemar配对c2检验或配对边际c2检验 2)一致性问题(Agreement):用Kap检验 变量之间的关联性分析六、两个变量之间的关联性分析 1.两个变量均为连续型变量 1)小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析 2)大样本或两个变量不服从双正态分布,则用Spearman相关系数进行统计分析 2.两个变量均为有序分类变量,可以用Spearman相关系数进行统计分析 3.一个变量为有序分类变量,另一个变量为连续型变量,可以用Spearman相关系数进行统计分析 七、回归分析 1.直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则应作适当的变换,使其满足上述条件。 2.多重线性回归:应变量(Y)为连续型变量(即计量资料),自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。 1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素 2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用 3.二分类的Logistic回归:应变量为二分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。 1)非配对的情况:用非条件Logistic回归 (1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用 2)配对的情况:用条件Logistic回归 (1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素 (2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用 4.有序多分类有序的Logistic回归:应变量为有序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。 1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素 2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用 5.无序多分类有序的Logistic回归:应变量为无序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。 1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素 2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用篇二:卫生统计学知识点汇总 1、 卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题和解决问题的重要工具。 2、 统计工作的基本步骤:①设计;②收集资料;③整理资料;④分析资料 3、 分析资料是根据研究目的计算有关指标描述数据的基本特征,选择适当统计方法对资料进行分析,阐明事物的内在联系和规律的过程。统计分析包括: ①统计描述:是指选用统计指标、统计表或统计图等对资料的数量特征及其分布规律进 行测定和描述 ②统计推断:是指选择恰当的统计方法由已知的样本信息推断总体的特征,包括参数估计和假设检验 4、 (1)①同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称之为同 质,或具有同质性 ②变异:我们将同质个体的某项特征或属性的观察值或测量值之间的差异称为变异 (2)①总体:根据研究目的确定的同质观察单位的全体,更确切地说,是同质的所有观察单位某种特征或属 性的观察值或测量值的集合。若总体明确了特定的时间和空间范围且包含有限个观察单位,称为有 限总体。若总体没有特定的时间和空间范围的限制,且包含的观察单位个数是无限的或几乎是不可 能准确计数的,称该总体为无限总体 ②样本:从总体中随机抽取的具有代表性的部分观察单位的集合 (3)①参数:反映总体特征的指标称为参数 ②统计量:根据样本观察值计算出来的指标称为统计量 (4)①变量:确定总体之后,研究者需要对每个观察单位的某项特征或属性进行观察或测量,这种特征或 属性称为变量。变量的观察值或测量值称为变量值或观察值 ②资料:变量值的集合称为资料。资料可分为定量资料(又称计量资料)和定性资料(又称分类资料) 两类。定性资料又可分为计数资料和等级资料 (5)①抽样研究:从总体中随机抽取样本,通过样本信息推断总体特征的研究方法称为抽样研究 ②抽样误差:由随机抽样造成的样本统计量与总体参数之间、样本统计量之间的差异称为抽样误差 产生抽样误差的根源在于个体变异,由于个体变异是普遍存在的,因此在抽 样研究中抽样误差是不可避免的,但它具有一定的规律性,可以用统计学方 法估计其大小 (6)概率:随机事件发生可能性大小的数值度量 当某事件发生的概率P≤0.05时,统计学中习惯上称该事件为小概率事件,表示在一次实验或观察 中该事件发生的可能性很小,可以视为很可能不发生。 5、 医学研究方法主要有调查研究、实验研究和文献研究。 6、 调查研究又称为观察性研究,具有以下特点:①不能人为施加干预措施;②不能随机分 组;③很难控制干扰因素;④一般不能下因果结论 7、 调查研究的类型:根据抽样比例可划分为全面调查以及抽样调查;根据调查时间可分为 横断面(现况)调查、病例对照研究、队列研究及回顾性队列研究;根据抽样概率可划分 为概率抽样调查及非概率抽样调查 8、 常用的抽样方法: ①单纯随机抽样:先将调查总体的全部观察单位统一编号,然后采用随机数字表、统 计软件或抽签等方法之一的随机抽取n(样本大小)个编号,由这n个编号所对应的n个 观察单位构成研究样本 ②系统抽样:又称机械抽样或等距抽样。事先将总体内全部观察单位按某一顺序号等 距分隔成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随 机抽出第i号观察单位,依次用相等间隔m机械在第2部分、第3部分直至第n部分内各抽出 一个观察单位组成样本③分层抽样:先按时对观察指标影响较大的某项或某几项特征,将总体分成若干层, 该特征的测定值在层内变异较小、层间变异较大,然后分别从每一层内随机抽取一定数量的观 察单位结合起来组成样本 ④整群抽样:将总体划分为群(初级观察单位),各群由次级观察单位组成,随机抽取一部分群,调查抽中群 的全部次级观察单位 ⑤多阶段抽样:单纯随机抽样、系统抽样、分层抽样、整群抽样是四种基本的常用抽样方法,它们的抽样误 差由小到大依次为:分层抽样,系统抽样,单纯随机抽样,整群抽样。但它们各有优缺点, 在实际中尤其在较大规模的抽样调查中,常常是将四种基本的常用抽样方法运用于多阶 段抽样中 9、 调查设计包括:调查准备阶段的设计、调查实施阶段的设计和调查总结阶段的设计三个 基本步骤 10、调查准备阶段的六项基本内容:明确调查目的和指标、确定调查对象和单位、选择 调查方法与技术、估计样本大小、编制调查表、评价问卷的信度和效度 11、调查实施阶段的设计(资料收集计划)包括:制订调查人员培训方案、确定资料的收集 方式等基本内容 12、调查总结阶段的设计(资料的整理与分析计划)包括:问卷的接受与核查计划、调查资料的计算机录入计划、 资料的分组计划、统计分析计划 13、任何一项调查研究,首先应明确调查目的,这是各个环节中最核心的问题。从调查研究 的设计分析角度来说,目的主要有三个:①了解参数(总体的指标),②比较事物,用 以优化方案或探索影响因素,③研究变量之间的关系,用于预测或控制 14、调查目的必须具体化到指标,调查目的是选定调查指标的依据。对指标有如下要求:具体、精选、客观、精 确性高、特异度和灵敏度高 15、问卷的提问原则:①简单明了;②避免混淆和模糊词语;③避免模棱两可或可能误解的问题;④避免诱导或 强制 16、信度即测量工具的可靠性,它是指采用相同测量工具(如问卷)对同一对象进行重复测 量时,各次测量值与其均值接近的程度。换言之,信度是指测量结果的一致性或稳定性, 即测量结果能否稳定地测量所测的事物或变量。信度指标通常用信度系数来评价,常用的信度指标有重复测量信度、复本测量信度、折半测量信度、内部连续性测量信度 17、效度是指测量工具、指标或观测结果在多大程度上反映了事物的客观真实性,即指观测结果与试图达到的目 标之间的接近程度,是对测量工具(如问卷)有效性的检验 18、调查资料的收集方式:直接检测、访谈、电话调查、信访、集中调查法 19、资料的整理与分析步骤:问卷的接受与核查、数据的计算机录入、资料的分组、统计学分析、医学专业分析 20、随机化原则是统计学的分析基础,盲法是克服测量偏倚的有效手段 21、实验研究是指研究者根据研究目的人为地对受试对象(包括人或动物)施加处理因素, 控制混杂因素,观察、总结处理因素效应的一种研究方法 22、实验设计是对实验研究所做的周密计划,包括实验研究的资料搜集、整理、分析全过程的设想和安排。通常 将满足条件的实验对象随机分配到两组或多组中去,观察比较不同处理因素的效应或结果 23、实验设计的特点:①研究者能人为设置处理因素 ②受试对象接受何种处理因素或水平是由随机分配而定的 24、实验设计的基本要素:处理因素、受试对象、实验效应 25、处理因素是指研究者施加于受试对象的因素(如某种药物、某种手术等),而有时受试者本身的某些特征也 可成为处理因素,如性别、年龄、职业、文化程度、民族、婚姻状况等 26、混杂因素是指影响实验效应并与处理因素同时存在的非处理因素 27、水平是指同一处理因素在数量上或强度上的不同程度28、处置处理因素要注意:①抓住实验中的主要因素 ②确定处理因素和非处理因素 ③处理因素标准化 29、控制混杂因素影响的方法:排除法、平衡法、标准化法 30、受试对象是处理因素作用的客体或对象。一般选择受试对象的原则是:①受试对象能从临床试验中受益,② 受试对象具有代表性,③受试对象具有依从性,④受试对象可以是志愿者 31、指标的选择应考虑指标的客观性、灵敏度和精确性。 其中精确性包括准确度和精密度。准确度是指观察值与真值的接近程度,说明观察有无系统误差。精密度是指重复测量或观察时,观察值与其平均值的接近程度,说明随机误差的大小 32、观察时最好采用盲法,避免产生偏性 33、实验设计的基本原则:对照原则、随机原则、重复原则、均衡原则 34、对照是指除了试验组外,再设置一个或多个对照组进行同步试验,以比较试验组的效应情况。其意义在于使 处理因素和非处理因素的差异有一个科学对比,鉴别处理因素与非处理因素之间的效应差异,消除或减少实验误差 35、对照的形式: ①空白对照:对照组不接受任何处理因素 ②安慰剂对照:采用一种无药理作用的假药作为对照。目的是显现出药物的真实效应,消除心理作用等因素 的影响 ③标准对照:用现有的标准疗法或药物作为对照 ④实验对照:对照组不施加处理因素,但施加某种与处理因素有关的实验因素 ⑤自身对照:也称为自身交叉对照。实验与对照在同一受试对象身上进行,其应用受一 定条件的限制,结论的推导应慎重 ⑥历史对照:用过去的研究结果作为对照 ⑦相互对照:几种实验组互为对照,比较几种处理因素的实验效应的强弱 36、设立对照时的常见错误:无对照、对照不足、对照多余 37、随机化的作用是使样本具有较好的代表性,使各组受试对象在重要的非处理因素方面具 有较好的均衡性,提高实验结果的可行性。 38、随机化包括随机抽样和随机分组 ①随机抽样:指保证总体中的每一个个体都有同等的机会被抽出来作为样本 ②随机分组:指保证样本中的每一个个体都有同等的机会被分配到实验组或对照组 一般用随机数字表、随机排列或统计软件包来实现随机抽样和随机分组 39、临床研究中常用的随机分配方法: ①简单随机化:可通过抛掷硬币、抽签、摸球、查随机数字表或应用计算机软件产生的随机数字来表现 ②区间随机化:根据受试者进入研究的时间先后顺序,将其分成含有相等列数的若干区组,而后,区组内的 受试者被随机分配到不同的处理组 40、重复是指研究样本要有一定的数量,即在保证研究结果具有一定可靠性的条件下,确定最少的样本列数 41、均衡原则又称齐同对比原则,指试验组和对照组或各实验组之间,除了处理因素以外,其他一切条件应尽可 能相同或一致。试验组和对照组的非处理因素不均衡,将导致错误的实验结果。其作用是使受试对象受到的非处理因素的影响完全平衡,使所研究的处理因素的真实效应显现出来 42、实验设计的基本步骤:①明确实验目的;②确定研究对象;③确定可比的实验组和对照组;④确定把受试对 象分配到各处理组中的原则;⑤确定样本含量;⑥确定方法和指标;⑦偏倚及其控制 43、选择偏倚是指在研究对象的选取过程中,由于选取方式不当,导致入选对象与未入选对 象之间存在系统差异,由此造成的偏倚称为选择偏倚。选择偏倚主要表现在描述性和分 析性研究中:①描述性研究的选择偏倚主要表现在样本的代表性上,如果没有遵循随机化原则进行抽样,而是使用某些特定人群志愿者、健康人(临床试验)等 控制方法主要是遵循随机化原则,采用随机抽样,避免样本选择偏倚,对特定群体的研究结果一般不要 任意外推 ②分析性研究的选择性偏倚主要表现在研究对象进入、排除、失访或不参与(研究对象不同意)等于处理因素存在关联,由此增大或减少处理与效应的关联,导致效应估计的偏倚。 确定有无选择偏倚的关键,在于把握选取环节或已入选对象,是否存在人为增大或减少研究因素与结局的关联程度 控制选择偏倚的方法主要是严格制定入选标准、排除标准,遵循随机化原则,注意选取 对象的代表性,减少脱落或失访等 44、信息偏倚又称测量偏倚或观察偏倚,是在收集资料(测量或调查)过程中由于方法不当或其他原因所引起的 系统误差。在疾病分类测量中产生的信息偏倚可称为错分偏倚。信息偏倚同样影响着描述性研究和分析性研究的结果 控制方法是严格制定测量或信息收集方法以及疾病分类的标准,对于测量人员或调查人员应该统一培训,掌 握测量和调查技巧与方法,尽可能采用盲法收集资料,尽量采用客观指标或记录,以及利用其他来源的信息加以核查,减少或避免信息偏倚 45、混杂偏倚是指暴露因素与疾病发生的相关(关联)程度受到混杂因素的歪曲或干扰所产生的偏倚 在设计阶段通过配比、随机化分配或限制进入(选择混杂因素的某个层的对象)等方法来控制。在统计分析 阶段可采用标准化率分析、分层分析和多变量分析等来控制 46、常用的实验设计方案:完全随机设计、配对设计、随机区组设计、交叉设计、析因设计、重复测量设计47、重复测量设计与随机区组设计的区别: (1)重复测量设计中的“设计”是在区组(受试者)间随机分配,区组内的各个时间点是固定的,不能随 机分配。随机区组设计要求每个区组内受试者彼此独立,处理只能在区组内随机分配,每个受试者接 受的处理是不同 (2)重复测量设计区组内受试者彼此不独立。重复测量设计的数据用随机区组设计方差分析比较处理组间 差异,前提条件是要求满足“球对称”假设 48、临床试验是以患者为研究对象的医学研究,通过对受试对象施加某些干预措施,如新药、 新疗法等,观察其对人体的作用、不良反应等,以确定治疗措施或药物的效果与安全性 49、临床试验特点:①前瞻性研究;②以人为研究对象;③社会因素影响;④主观因素影响;⑤同一治疗方案 50、临床试验的基本原则:随机、对照、均衡、重复和盲法 篇三:卫生统计学知识点汇总 第一讲 绪论 总体:是研究目的所确定的所有同质个体某指标实际值的集合;或说, 总体是根据研究目的确定的所有同质 观察对象的全体。 样本:根据随机化的原则从总体中抽取有代表性的部分观察单位,其变量实测值构成样本。 样本含量:样本所包含个体或个体值的个数。 抽样(Sampling) :从总体中抽取有代表性的一部分样本的过程,称为抽样。 抽样研究:从确定的同质总体中随机抽取部分样本进行观察,用样本信息来推断总体特征,该研究方法叫抽样 研究。 统计推断:样本的现象推断所研究总体的特征。即分析样本数据,获得关于总体的知识。 同质(homogeneity):指研究对象在一定范畴的各种可能影响主要观察指标的其它因素处于相同或非常相似的 情况,即把具有相同性质的观察单位简称为同质的(homogeneous),否则称为异质的(heterogeneous) 。 变异(variation):同质基础上的各观察单位间的差异 参数:根据总体变量值统计计算出来,描述总体特征的统计指标。 统计量:根据样本个体值统计计算出来,描述特征的统计指标。 变量:变异性表现为取值上的大小就是变量。通常把观察单位的观察指标称为变量。如身高、体重等 变量值:观察单位 的观察值 叫变量值,如身高 118cm,体重26kg 等。 误差:为观察值(X)与实际值(μ)之差。 抽样误差(sampling error) :由抽样造成的样本统计量和总体参数的差别、以及样本统计量之间的差别称为 抽样误差。 随机事件(Radom event):随机试验中可能出现的各种结果,叫随机事件。即在一定条件下具有多种可能发生的 结果,而究竟发生那一个结果不能肯定,又称偶然事件。 概率(Probability):描述随机事件发生的可能性大小的一种度量,常用P 表示。 小概率事件:当随机事件A的概率P(A)≤?,习惯上,当?=0.05时,就称A为小概率事件;其统计学意义是小 概率事件在一次随机试验中不可能发生。 频率(Frequency):m,则:m)称为事件A在n次试验中发生的频率。 统计描述:用统计指标、统计表、统计图等方法,对样本资料的数量特征及其分布规律进行描述 统计推断:指用样本信息推断总体特征,包括参数估计和假设检验。 第二讲:数值变量的统计描述
一、频数表与频数分布图 (一)基本概念: 频数( frequency ):指在一个抽样资料中,某变量值出现的次数。 频数分布表(frequency distribution table):将各数值变量的值及其相应的频数列表,简称频数表。频率是表示 频数出现机率的指标,可用百分数或小数表示,频率为100%或1。 频数分布图(frequency distribution figure) :根据频数分布表,以变量值为横坐标,频数为纵坐标,绘制的 直方图。 (二)连续型变量频数表的编制方法: ⒈ 求全距(Range,简记R ):是一组资料中最大值(Xmax)与最小值(Xmin)之差,亦称极差。 2. 定组距:将全距分为若干段,称为组段。组与组之间的距离,称为组距;用小写i 表示。 原则:(1)D组段‖数一般为10-15个; (2)D组距‖一般为R/10取整; (3)为计算方便根据组距采取取整数方法 3.写组段:即将全距分为若干段的过程。 原则:(1)第一组段要包括Xmin,最末组段包括 Xmax ; (2)每组段均用下限值加 D~ ‖表示,最终组段同时注明上下限。 4. 列表划记:根据预定的组段和组距,用划记的方法整理原始资料。 (三)频数表的用途: 1.揭示频数的分布特征:集中趋势与离散趋势结合能全面反映频数的分布特征 2.揭示频数的分布类型 对称分布 :
集中部位在中部,两端渐少,左右两侧的基本对称,为。 正偏 :集中部位偏于较小值一侧(左侧),较大值方向渐减少,为。 负偏 :集中部位偏于较大值一侧(右侧),较小值方向渐减少,为负偏态分布。 3.便于发现某些特大或特小的可疑值。 4. 样本含量足够大时,以频率作为概率的估计值。 5.作为陈述资料的形式。 二、集中趋势的指标 集中趋势:用于描述一组计量资料的集中位置,说明这种变量值大小的平均水平,常用平均数(average)表示。 注意:1.同质的事物或现象才能求平均数 2.应根据资料分布状态选用适当的均数。
算术均数:
单峰对称分布 包括几何均数:
对数正态分布 中位数、百分位数 :
偏态分布 (一) 算术平均数(arithmetic mean) ● 使用条件:数据分布比较均匀呈正态分布或近似正态分布。 ● 样本均数用符号:X 表示 ● 总体均数用符号:μ表示 ● 计算方法有两种:直接法(小样本)和加权法(大样本) (1)直接法: 举例: 某地10名18岁健康男大学生身高为(cm): 168.7,
170.0,170.4,172.1, 167.6,
170.7,177.3,169.7 求平均身高? ? 适用范围:小样本资料,n&30 ?……、Xn直接相加,再除以观察值的个数n。 ?(2)加权法: ? 适用范围:大样本含量的分组资料或频数表资料。 ?
Σf x,然后除以总频数Σf。 ? 举例: 用加权法计算某市8岁男童身高平均数(表3.1 )
①计算各组段的组中值xi、fxi和Σfx 第1组段: x 1 ?下限 ? 上限 2 ? 2 ? 117.5 ② 用加权法计算该组身高值的均值
● 概念:对一组观察值,先进行对数变换,按算术均数计算方法求其对数值的均数,该均数的反对数值即几何均数(G)。 ● 使用条件:用于原始数据分布呈偏态分布,等比资料(倍数变化)或对数正态分布资料的平均数的计算。 ● 表示符号:G ● 计算方法:直接法和加权法 (1)直接法: ? 适用范围:小样本资料 ?? 举例:设有5份血清样品,滴度分别为:1:1,
求其平均滴度。 G= ?10?100??100
或 G=lg-1((lg1+lg10+lg100+lg1000+lg10000)/5)=lg-1((0+1+2+3+4)/5) =lg-12 =100 即:平均滴度为1:100;较好地代表了观察值的平均水平。
(2)加权法: 适用范围:大样本含量的分组资料或频数表资料。 举例:有3.3)。表3.4
95名儿童的血凝抑制抗体平均滴度计算(加权法) 抗体滴度 滴度倒数 频数 lgX f2lgX
① ② ③ ④ ⑤=③3④
4 4 0.4 1: 8
8 9 0.9 1:16 16 16 1.6
1:32 32 34 1.4 1:64 64 18 1.6
1:128 128 8 2.6
1:256 256 5 2.0
≥1:512 512 1 2.3 合计
145.0948 G= lg-1 (Σf lgX/Σf )=lg-1(145.0948/95) =33.68 即95名易感儿童接种疫苗一个月后,血凝抑制抗体的 平均滴度为1:33.68。 计算几何均数(G )注意事项: (1)观察值不能为0; (2)观察值不能同时有正有负; (3)同一组资料求得的几何均数小于算术均数。 练习: 1.有8份血清的抗体效价分别为:1:5, 1:10, 1:20, 1:40, 1:80, 1:160, 1:320, 1:640
求平均抗体效价。 ?1 G?lg[(lg5?lg10?????lg640)/8]将各抗体效价的倒数代入公式: ?lg?1(1..57 所以血清的抗体平均为1:56.572.有50人的血清抗体效价,分别为:5人
求平均抗体效价。 将各抗体效价的倒数代入公式: 所以该50人的血清抗体效价为1:41.70 (三)中位数(Median,M) ● 概念:把一组变量值从小到大排列,位于中间位置的变量值叫中位数,用M表示。 ● 使用条件:当一组资料类型分布不清或明显 偏态分布时的平均数的计算。 ● 表示符号:M ● 计算方法:直接法和加权法 百分位数(Percentile,P)● 概念:为一种位置指标,表示位于全部观察值第X%位置处的数值。一个PX将总体或样本的全部观察值分为两部分,理论上有X%的观察值比它小,(100-X)%的观察值比它大,P50分位数即是中位数。
● 表示符号:Px ● 计算方法: 频数表计算 (1)直接法由原始数据计算中位数: 当n为奇数时:
(2)用频数表计算中位数和百分位数 步骤: 按所分组段,由小到大计算累计频数和累计频率
代入公式计算中位数及其它百分位数 中位数计算公式百分位数计算公式 注:fm 、 fx为所在组的频数, i 为该组段的组距, L为其下限 ,∑fL 为小于L的各组段的累积频数。

我要回帖

更多关于 样本量多少才有统计学意义 的文章

 

随机推荐