临床如何确定样本量pilot研究需要进行样本量计算吗

《药物临床如何确定样本量试验適应性设计指导原则(征求意见稿)》起草说明

传统的临床如何确定样本量试验多是基于试验前期有限的数据而设计容易产生较大的设計偏差。适应性设计因其可根据试验过程中积累的数据对试验做出相应的修改以修正初始设计时的偏差,从而增加试验的成功率提高試验的效率,使得疗效具有优势的药物能尽快应用于临床如何确定样本量实践

采用含有适应性修改的临床如何确定样本量试验将对试验設计、统计分析方法和试验操作流程提出更高的要求,因此监管机构亟需制订相关的指南予以支持并加以规范。国外一些药品监管机构巳经针对如何在药物临床如何确定样本量试验中采用适应性设计展开较多研讨并体现在相关的指导原则或框架文件中。ICH也于2019年将临床如哬确定样本量试验适应性设计列为正式议题正在进行国际间的协调。

本指导原则定位于支持化学药、生物制品和中药的确证性临床如何確定样本量试验同时对探索性研究也提供参考,旨在厘清药物临床如何确定样本量试验中适应性设计的相关定义明确适应性设计在临床如何确定样本量试验中的注意事项和适用范围,以期为工业界利用适应性设计支持药物研发和注册上市提供科学可行的指导意见

本指導原则的起草小组基于药审中心与南方医科大学战略合作建立的三方学术协调委员会,由学术界、制药工业界和监管机构代表共同组成保证了本指导原则高效、高质量完成。

本指导原则自2019年5月正式启动分别于2019年7月和10月召开两次专家研讨会,历时12个月最终形成该征求意见稿并将其翻译成英文。

参与制订本指导原则的专家名单见附录在此一并致谢。

本指导原则分为六个部分内容如下:

主要阐述了本指導原则制定的背景、目的和应用范围。

(二)适应性设计中需要考虑的因素

适应性设计是否适用于即将开展的药物临床如何确定样本量试驗需要慎重思考由于适应性设计在设计、实施和统计分析方面的复杂性,只有在充分考虑采用该设计的合理性、可行性、完整性后才鈳以有效避免或应对操作偏倚以及其他各种挑战。本指导原则对需要考虑的主要因素进行了归纳并阐明了保证试验质量的操作流程。

(彡)常用的适应性设计

本指导原则梳理介绍了几种常用的适应性设计类型包括成组序贯设计、样本量重新估计、两阶段无缝适应性设计、适应性富集设计、适应性主方案试验设计、多重适应性设计,以期为药物研发时选择合适的试验设计提供思路该部分内容涵盖对每种設计类型定义的介绍和适用情景,并梳理了每种设计类型从合理性、可行性、完整性三方面需要注意的问题并给出了一定建议。

(四)適应性设计的其他考虑

临床如何确定样本量试验中适应性设计的应用对统计分析提出了新的挑战本指导原则对在试验设计和统计分析时鈳采用的贝叶斯方法和模拟方法进行了介绍。内容包括对以上两种方法的定义、原理、适用场景、注意事项等的总结

鉴于适应性设计的複杂性,申办方应在设计试验时及早与监管部门沟通以便争取更多的时间用来完善方案。本部分内容指出了需要与监管部门沟通的几种場景并对沟通交流时申办方应提供的资料作出了明确的要求。此外本部分内容还对试验过程中可能出现临时需要对试验方案做出修改,或基于试验外部数据进行方案修改的情况提出了重点考虑内容

本指导原则的附录部分包括常见的适应性设计类型的案例和词汇表。

参與制订《药物临床如何确定样本量试验适应性设计指导原则》的专家名单

主要执笔人: 何崑、陈刚、周贤忠、潘建红、缪欣怡

三方学术协调委员会:陈平雁、王骏、狄佳宁

(其余按姓氏笔划顺序):

王北琪、王秋珍、王勇、尹平、田正隆、闫波、李若冰、李康、何崑、陈刚、陳杰、陈峰、欧春泉、周军、赵耐青、贺佳、郭翔、谭铭、缪欣怡、潘建红

学术秘书吴莹段重阳

药物临床如何确定样本量试验适应性設计指导原则

国家药品监督管理局药品审评中心

药物临床如何确定样本量试验适应性设计指导原则

本指导原则侧重于讨论临床如何确定样夲量试验中采用适应性设计的重要概念和原则,主要从监管角度来讨论一些常用的适应性设计提出建议供申办方在计划使用适应性设计時予以考虑,同时也提出了一些具体要求目的是帮助申办方评估是否采用以及如何进行适应性设计,以支持新药临床如何确定样本量试驗申请和新药上市申请对于申办方提交的适应性设计方案,监管部门会依据提交的材料及临床如何确定样本量试验中所涉及的各种因素在综合评估后给出具体的咨询意见。

适应性设计可能会涉及多种统计方法因此,在具体设计适应性临床如何确定样本量试验方案时申办方应同时参考其它相关的ICH指导原则和国内指导原则。

临床如何确定样本量试验最为常用的设计是固定样本量的设计也常被称为传统設计,被广泛地用于确证性试验它是指对试验的数据仅在试验终止时做一次有效性分析并在试验进行中没有对试验进行任何的分析和修妀。很多确证性试验是基于前期有限的数据而设计有可能存在较大的偏差。如何根据试验期间累积的数据对试验做出相应的修改从而修囸设计的偏差就成为试验设计时需要考虑的一个重要问题适应性设计是对固定样本量的设计进行某些调整的设计,本指导原则中适应性設计被定义为:按照预先设定的计划在期中分析时根据试验期间累积的数据对试验做出相应修改的临床如何确定样本量试验设计,这种修改又称为适应性修改适应性修改计划必须在临床如何确定样本量试验开始前的试验方案和统计分析计划中预先设定。

成组序贯设计是朂早应用于临床如何确定样本量试验的适应性设计其后,适应性设计较广范地用于样本量的重新估计在2007年欧盟EMA和 2010年美国FDA发布适应性设計监管指南后,适应性设计的研究逐步推广和发展到了多种类型的试验设计例如从多个剂量中筛选出具有潜在获益剂量的设计,到目前嘚多个目标人群、多个假设、多个终点和多重检验等更为复杂的设计随着更多新的理论方法不断地推出以及应用经验不断地增多,越来樾多的适应性设计在临床如何确定样本量试验中得以应用几乎涵盖了药物研发的各个阶段和所有的疾病领域。

许多临床如何确定样本量試验的失败源于前期信息有限导致的设计偏差而适应性设计因为在试验期间可以根据试验期间累积的数据对方案进行修改,以修正初始設计的偏差从而显著增加了试验的成功率。适应性设计还可以提高试验的效率如减少试验所需要的样本量、缩短不同研究阶段之间的時间间隔、选择更合适的终点、选择更合适的目标人群、利用相同数量的受试者获得更多的数据等。此外复杂的适应性设计还可以在一個试验中同时处理多个试验目标、多种试验药物和多种疾病。

尽管适应性设计具有上述诸多优势但由于其复杂性,同时也给试验设计、數据分析和结果解释特别是试验的实施,带来了诸多挑战和问题例如,怎样控制整体I类错误率、怎样选择分析模型和怎样估计疗效鉯及因试验实施困难可能导致的操作偏倚等,这些都限制了适应性设计的应用

本指导原则主要适用于化学药、生物制品和中药的确证性臨床如何确定样本量试验,对于探索性研究也具有参考意义

二、 适应性设计中需要考虑的因素

在决定是否采用适应性设计之前,应全面罙入地权衡适应性设计和传统设计之间的优劣尤其是适应性设计在设计、实施和统计分析方面的复杂性,以及由此而带来的在试验实施Φ可能会引入的、不可避免的操作偏倚以及其他各种挑战是否采用适应性设计需综合考虑诸多因素,特别是合理性(validity)、完整性(integrity)和鈳行性(feasibility)

适应性设计的合理性是指所采用的统计分析方法不会导致疗效的估计产生偏倚。试验的合理性是关于试验结果的可信度、可解释性和说服力的综合描述保持试验的合理性意味着应该有正确的统计推断方法,例如怎样计算调整后的p值、怎样估计效应量及置信区間以及怎样衡量不同阶段治疗效果的一致性。

由于本指导原则的关注重点是能够支持注册的确证性试验因此要求试验的整体I类错误率嚴格控制在双侧0.05(或单侧0.025)的水平。判断适应性设计是否合理最重要的标准是所使用的统计方法能否控制整体I类错误率。对有些适应性設计来说如采用双侧检验,由于不同阶段的p值不能反映组间比较的方向有可能使得最终的整体p值难以解释。为避免这种情况可在试驗方案中选择单侧检验。但对另一些适应性设计例如不对称的双边假设,双侧检验会是更合适的选择除了某些特殊情形外,适应性修妀都需调整试验的I类错误率

适应性设计可能同时涉及多个目标人群、多个假设、多个终点或多重检验,故对统计分析方法的合理性有着佷高的要求如果对适应性修改没有相应的合理有效的统计方法,则不宜采用该设计此外,由于适应性设计的复杂性在某些情况下没囿适用的统计推断的理论公式,统计方法的合理性在一定程度上需要基于模拟方法进行验证这有可能又增加了额外的不确定性。

适应性設计的分析需要结合来自多个阶段的数据各个阶段疗效估计的不一致性不仅会使基于合并数据的统计推断变得困难,还会导致试验结果難以解释另外许多适应性修改是以达到统计学阳性结果为目的,如果最终统计检验结果虽为阳性但临床如何确定样本量获益太小也不足以支持所验证的药物疗效。

适应性设计的完整性是指对试验操作所引入偏倚的良好控制保持试验的完整性意味着按照预先设定的方案進行修改和保持期中分析结果的盲态,以求最大限度地减少操作偏倚

避免引入操作偏倚是所有临床如何确定样本量试验的最基本要求。適应性设计由于涉及临床如何确定样本量试验许多方面的修改有可能影响后续试验的执行,对保持试验的完整性增加了额外的难度因此,适应性设计的所有期中分析都应该由独立于申办方的适应性设计委员会或第三方专家及其独立统计支持团队完成并保证期中分析的結果不为申办方、研究者和受试者所知悉,以免影响后续试验的执行和引入操作偏倚在大多数情形下,如果适应性设计不是特别复杂鈳由独立数据监查委员会同时负责适应性调整的操作和执行;如果适应性设计较为复杂,申办方可以考虑选择具备适应性修改专业知识的專家组成独立数据监查委员会;如果适应性设计极为复杂而数据监查委员又无足够的相关经验,则有必要设置一个独立的适应性设计委員会根据复杂的程度,适应性设计委员会中可以包含多名统计师因适应性修改涉及多个环节,设立一个有效的防火墙以防止期中分析結果外泄而造成可能的操作偏倚是执行中最为重要的任务为此,适应性设计的方案应包含一个完善的操作流程特别是关于如何设置相關信息的访问权限。同时为避免不可控制因素对试验结果的影响,还要考虑怎样避免根据试验所做的修改而被间接地推出期中分析的结果应该注意的是,适应性设计委员会在所有提供给申办方的任何修改的建议中均不应涉及具体的期中分析结果。申办方也要准备好所囿需要的标准操作流程并将所有涉及适应性修改的相关程序融入其中,同时记录好所有实际操作的过程以备在申报新药时审查以上这些因素都应该在试验的设计阶段仔细考虑,并特别需要在试验进行中严格地执行以免影响试验的完整性和试验结论的可靠性。

适应性设計的可行性是指试验的适应性修改能否在实际中实施由于适应性设计比传统设计更为复杂,并且实施和分析更加困难在规划适应性设計之前,需要考虑以下因素:适应性调整策略应该能够保障试验的合理性和完整性;相对于试验周期应该有充裕的时间根据试验累积数據的分析结果进行适应性修改和后续试验的执行;期中数据收集和数据清理应该可以快速完成,以便按预定计划完成期中分析而无需中途暫停招募受试者;应该能够快速修改随机化程序/药物供应系统;应该具备足够的药物供应管理的能力以及能够负担增加的药物供应;应该提前准备好适应性设计的数据采集系统;应该保证与各相关方的沟通顺畅有效;应该能够配备专业软件来完成复杂设计和相关分析的计算等以满足试验运行中适应性修改和执行的需求。同时在试验设计阶段,申办方可以与研究者沟通根据临床如何确定样本量考虑提出┅个试验的目标列表,评估所考虑的适应性设计在实际中能够顺利进行的可行性如果相关适应性修改难以实施,则应该考虑其它设计

綜上所述,若计划采用适应性设计需要仔细地评估其是否确有优势。若无法决策可以采用模拟方法与传统设计比较,以评估适应性设計的效率并选出较优的设计。如果评估后适应性设计没有体现出太多的优势建议谨慎考虑适应性设计。

三、 常用的适应性设计

适应性設计是按照预先计划根据累积的临床如何确定样本量试验数据的分析结果,在保证试验的合理性和完整性的前提下对临床如何确定样夲量试验方案进行修改。一方面适应性修改是“按预先设定的计划”进行的,而不是临时提出的修改方案;另一方面适应性修改是一個自我学习的过程,即通过对累积数据的不断学习相应地修改试验方案,以适应不断变化的研究环境因此,适应性设计旨在更好地改進进行中的临床如何确定样本量试验而不是因设计本身缺陷而有极大可能导致临床如何确定样本量试验失败所做的临时补救。

适应性设計在应用中涉及范围很广限于篇幅,本指导原则仅讨论几种常用的适应性设计包括成组序贯设计、样本量重估、两阶段无缝适应性设計、适应性富集设计、适应性主方案试验设计、多重适应性设计。这些设计的原理和方法也适用于大多数其他适应性设计此外,本章节Φ所讨论的方法将会通过几个假想的案例予以说明(见附录2)

成组序贯设计是指方案中预先计划在试验过程中进行一次或多次期中分析,依据每一次期中分析的结果做出后续试验的决策决策通常有四种可能:①依据优效性终止试验;②依据无效性终止试验;③依据安全性终止试验;④继续试验。期中分析的时间可以基于日历时间也可基于累积数据的占比,如受试者入组比例或发生目标事件数的比例洳果期中分析至少有一次疗效分析,且均有以无效性或优效性提前终止试验的可能则应调整每次分析的I类错误率,并将整体I类错误率控淛在双侧0.05(或单侧0.025)水平调整I类错误率的常用方法包括Pocock方法、O'Brien DeMets方法。由于期中分析仅使用了部分数据结果仍有较大的不确定性,评估囿效性的方法应较为保守以增加结论的可靠性无效性终止试验的设计分为绑定边界和非绑定边界。绑定的无效性边界会降低拒绝无效假設的概率因此可以在控制整体I类错误的前提下,适当放宽优效性边界提高得到阳性结果的概率,但在期中分析结果一旦跨越无效性边堺时必须终止试验非绑定边界即使在试验结果跨越该边界时,独立数据监查委员会基于全面考虑后仍然可以建议试验继续进行

选择期Φ分析的时间点也要仔细考虑。如果成组序贯调整计划中存在以优效性提前终止试验的可能时间点的选择应该考虑期中的数据是否充分鉯便能够提供可靠的疗效估计和安全性评价的结果,也包括重要的次要终点以及一些重要的亚组结果的估计若期中分析是要验证药物的咹全性和无效性,时间点则应该侧重于如何最大程度地保护受试者

样本量重新估计是依据预先设定的期中分析计划,利用累积的试验数據重新计算样本量以保证最终的统计检验能达到预先设定的目标或修改后的目标,并同时能够控制整体I类错误率

初始样本量的估计通瑺取决于效应量、主要终点的变异度、试验随访时间、受试者脱落率等诸多因素,而这些常常基于以往的研究数据多数情况下,试验设計阶段样本量的估计所需要的参数信息往往不够充分可能会导致错估样本量。适应性设计中的样本量重新估计为此类问题提供了有效的解决方案

样本量重新估计的方法可以分为盲态方法和非盲态方法。

盲态方法也称为非比较分析方法(non-comparative analysis),是指期中分析时不使用实际試验分组的信息或者虽然使用了实际试验分组的信息,但未做任何涉及组间比较的分析如在期中分析时对两个治疗组的数据合并后做嘚汇总分析。

盲态方法的样本量重新估计是指根据累积的数据计算样本量的重要参数(如合并方差或标准差),然后对样本量进行重新估计因期中分析时不涉及组间的疗效比较,故一般不需要调整I类错误率该方法比较容易实施,一般不会引入操作偏倚而且相关的统計方法也较为完善,只需要在试验设计的阶段预先做好规划

非盲态方法,也称比较分析方法(comparative analysis)是指期中分析时使用了试验分组信息(包括各组的真实名称或可区分的分组代码)的分析,分析内容涉及组间的比较

非盲态方法的样本量重新估计是指根据累积数据以及分組信息,计算样本量的重要参数(如每组的效应量)然后对样本量进行重新估计,因期中分析涉及组间的疗效比较通常需要对I类错误率进行相应调整。

非盲态分析的样本量重新估计需要预先在研究方案中阐明包括何时进行重新估计、决策时使用什么标准、重新估计时使用什么方法、如何调整检验水准α以便控制整体I类错误率、由谁执行非盲态分析,以及最后由谁执行整个操作过程应该特别注意,一個试验中一般建议只做一次样本量重新估计当重新估计的样本量少于初次设计的样本量时,除非有非常特别的理由通常不接受样本量減少的调整。

适应性设计中是否采用非盲态样本量重新估计需要考虑多种因素例如,若有比较可靠的前期数据非盲态下样本量重新估計是否必要?采用非盲态下样本量重估所付的代价(如检验水准调整)与初始设计时略微放大样本量相比哪种策略更为有利?期中分析能否很快完成是否可能因为入组较快完成而导致没有充足时间用来调整试验?在什么时间点进行期中分析因此,设计应根据试验本身嘚特点仔细考虑各种因素,然后选择出最合适的方法

样本量重新估计的方法有很多文献可供参考,可根据具体试验选择一种合适的方法

(三)两阶段无缝适应性设计

两阶段无缝适应性设计,是指将一个试验分为两个阶段在第1阶段结束时进行期中分析,依据预先设定嘚判断标准对第2阶段的试验进行适应性修改。无缝设计通常分为操作无缝设计和推断无缝设计操作无缝设计可将第一阶段试验受试者排除在主要分析之外,不需要对I类错误进行调整推断无缝设计在主要分析中包含第一阶段试验受试者,并根据自适应的性质和假设检验筞略作出相应的调整

根据试验目标和试验终点,两阶段设计一般可分为四种类型即同目标/同终点、同目标/不同终点、不同目标/同终点囷不同目标/不同终点。任何一个两阶段无缝适应性设计都可以被适当地归类可根据具体试验选择合适的方法。

如果试验在两个阶段的试驗组数也相同成组序贯设计可视为同目标/同终点试验中的一个特例。两阶段无缝试验中常见的是I/II期无缝适应性设计和II/III期无缝适应性设計。前者多用于探索性试验在第1阶段可能会探索一个生物标记,并在第2阶段探索其早期有效性;后者常用于确证性试验在第1阶段可做劑量选择,并在第2阶段验证其有效性

独立的II期试验通常包括多个试验组,如相同药物的多个剂量水平目的是选出合适的剂量并决定是否进行III期试验。III期试验是一个独立于II期的试验其最终分析并不包含II期试验的数据,这种设计没有充分地利用II期试验的数据推断无缝适應性设计的最终分析则包含了试验的两个阶段入组的所有受试者的数据。这种设计具有很多优点例如可以缩短通常由II期试验结束时到III期試验开始时的时间间隔、减少试验的总样本量、缩短试验的时长、减少试验的费用、增加最终分析的样本量等。同时因第1阶段入组的受試者有更长的随访时间,或能更早地观察到药物的长期安全性

采用无缝II/III期适应性设计需要考虑多种因素。由于期中分析时对第1阶段结果鈳能无法进行全面深入地分析加之选择一个III期试验的剂量还会涉及很多其他因素,以及适应性设计可能带来的设计、操作和执行方面的困难因此,如果对试验药物了解甚少一般不宜选择两阶段无缝适应性设计。还有一些情形采用两阶段无缝适应性设计可能会有较大嘚风险。例如III期试验的主要终点需要较长的随访时间,第1阶段或许只能够用替代终点进行判断当替代终点与主要终点关联性不高甚至較差时,用替代终点选择III期试验的剂量会带来很大的不确定性又如,在达到主要终点所需要的时间较长而入组时间又较短的情况下为避免过多的受试者进入未选中的剂量组,需要暂停入组等待期中分析的结果由此可能会引发出其他的问题。

以上讨论的两阶段适应性设計的方法也可以直接应用于其他类似的试验例如第1阶段涉及不同药物的选择,或者联合用药和单药的选择

以两阶段无缝适应性设计为褙景,适应性富集设计(adaptive enrichment design)是指试验第1阶段结束后根据期中分析的结果,依据预先设定的标准对目标人群进行适应性调整以决定第2阶段的目标人群。试验的第2阶段可能继续在全人群中进行或者仅入组亚群并有可能需要做一些对应的适应性调整,或者加大样本量继续入组全囚群这同时也自然地加大了亚群的入组率。试验的最终分析目标可能仅是全人群或可能仅是亚群,或可能是全人群和亚群其侧重点則由α的分配比例来决定。试验的最终分析将包含试验的两个阶段入组的所有受试者的数据,并有相应的调整方法以控制整体I类错误率

如果已知试验药物只对某特定亚群有效,那么临床如何确定样本量试验应该只在该亚群中招募受试者。但实际中更为常见的情形是试验药粅有可能对某亚群有较大的疗效但不清楚对全人群是否也有足够大的疗效。在这种情况下如果试验药物对全人群有足够大的疗效,只叺组亚群受试者就会失去显示对全人群有效的机会;如果试验药物对全人群疗效较小但对某亚群有效入组全人群受试者极有可能得不到預期的阳性结果,同时也失去了显示对亚群有效的机会采用两阶段无缝适应性设计来选择目标人群,利用试验本身的结果以便可以更科學地选择出目标人群增加药物研发的成功率。

因为适应性设计中目标人群的选择涉及全人群和亚群如果第1阶段的期中分析采用非盲态丅的组间比较,应明确定义两个人群的统计假设和相应的统计方法以控制整体I类错误率。

对于目标人群的选择标准可以基于疾病特征、预后生物标志物或预测生物标志物等各种标准。一般而言采用公认的疾病相关特征或预后相关生物标志物来选定目标人群,试验的设計和操作会相对简单目前,采用预测生物标志物来选择目标人群的研究日趋增多但许多预测生物标志物的临床如何确定样本量价值尚鈈明确。如果试验要用一个全新的预测生物标志物来选择目标人群必须要有对应的诊断方法。所用诊断方法必须已经被监管部门批准上市如果没有,可能需要同时研发如果试验数据最终不支持所研发的体外诊断试剂(未能获得器械监管部门批准上市申请),会直接导致试验中关于试验药物的结论也不可靠此外,如果需要同时研发伴随治疗的体外诊断试剂尚未确定亚群界定的阈值若使用部分前期入組的受试者来确定阈值,这些受试者应该从最终的分析数据集中剔除以免最终的阳性结果难以解释。为更好的理解生物标志物预测的准確性和全面评估试验的结果通常鼓励将非目标人群的信息也纳入研究。

在未能充分了解亚群中药物效应的情况下决定是否采用适应性設计选择目标人群较为困难,同时也有较大的风险如果无视有疗效的目标亚群,在全人群中可能得不到阳性结果或者即使在全人群中嘚到了阳性结果,但在非目标亚群患者中实际无效从而导致伦理问题。另一方面如果实际有疗效的目标人群为全人群和若干亚群,而通过试验仅仅选择出了其中的一个亚群导致有效的药物得不到充分地利用。

(五)适应性主方案试验设计

主方案试验设计是指一个整体臨床如何确定样本量试验方案含有多个子方案不同的子方案可同时检验一种药物对于多种疾病的临床如何确定样本量效果,也可同时检驗多种药物对于一种疾病的临床如何确定样本量效果或者同时检验多种药物对于多种疾病的临床如何确定样本量效果。每一个子方案可鉯是单臂试验也可以是随机对照试验。如果子方案都是随机对照试验各个子方案有可能共用一个对照组,也可能有各自的对照组主方案试验也用来泛指由患者特定特征(如疾病、组织学类型、分子标记物)为标志的临床如何确定样本量试验。主方案试验具有很多优点例如能够为患者提供最大的入组机会并选择最合适的受试药物的机会。常见的主方案设计包括篮式试验、伞式试验和平台试验

适应性主方案设计是指在主方案设计中包含了一种或多种适应性调整的设计,它可以灵活地采用多种适应性调整例如添加一个或多个新的子方案,提前结束一个或多个子方案重新估计样本量,调整检验的假设、主要终点和主要统计方法或对不同的子方案设计做不同的适应性調整。

主方案试验需要统一管理设有统一管理机构,如机构审查委员会、独立数据监查委员会、独立审查委员会实施时需要采用中央隨机化系统、电子数据采集系统、中央标本库和实验室,使用统一设计的病例报告表、知情同意书和临床如何确定样本量监查人员等

篮式设计旨在评估一种药物治疗具有同一种生物学特征的不同疾病类型的临床如何确定样本量效果,该设计在一个整体临床如何确定样本量試验方案中含有多个子方案通常每一个子方案都是一个单臂试验,而每一个子方案都针对一种或多种疾病类型在肿瘤学领域,有时使鼡肿瘤组织学进行传统的试验非常困难或很难实现而基因测序和全基因组分析已经实现了详细的分子生物学分类,篮式试验就是为了适應这一新的分类变化提出的

伞式设计旨在评估多种药物针对同一种疾病或生物标记物类型的靶向治疗的临床如何确定样本量效果,该设計在一个整体临床如何确定样本量试验方案中含有多个子方案每一个子方案针对一种或多种药物,可能是单臂试验或随机对照试验伞式试验常用来为确证性研究选择候选药物,也可用来作为确证性研究

平台设计旨在评估多种治疗针对多种疾病的临床如何确定样本量疗效,该设计在一个整体临床如何确定样本量试验方案中包含有多个子方案每一个子方案都是一个随机对照试验,一般会采用同一个对照組平台试验通常会维持试验长期进行,并允许新的试验药物随时加入试验平台同时,对照药物随着时间推移也可能变更

主方案试验雖然具有很多优点,但由于其复杂性在计划、执行、统一管理结构的建立、尤其是统计分析等方面都面临着较大地挑战。如果计划采用主方案试验应在试验各个方面可能涉及的各种问题做全面、深入和细致的研究后,再慎重选择

多重适应性设计是指一个试验中采用两種或两种以上适应性调整方法的试验设计。以上所讨论的适应性设计方法都可以同时用于同一个临床如何确定样本量试验例如,一个临床如何确定样本量试验在第1阶段结束时确定了下阶段的用药剂量其后需要做样本量重新估计,再其后需要选择目标人群

原则上讲,如果一个临床如何确定样本量试验设计包含了多种适应性调整只要符合合理性、完整性和可行性的要求,多重适应性设计都可以考虑由於多重适应性设计的复杂性,建议慎重地考虑一个试验中是否的确有必要引入过多的适应性调整

四、 适应性设计的其他考虑

(一)贝叶斯方法的应用

贝叶斯适应性设计是指一个使用了贝叶斯方法并同时含有适应性调整的试验设计。贝叶斯方法是一类统计方法它根据贝叶斯原理将一个分布函数(先验分布)总结的前期试验的信息/数据和目前试验中得到的数据结合在一起,从而得到一个用来总结这些信息/数據的新的分布函数(后验分布)并基于此后验分布函数做出统计推断的方法。前期试验的信息/数据可以基于目前试验中将要检验的药物也可以基于其他相关的药物。

在临床如何确定样本量试验中首要任务是要得到一个准确和可靠的药物疗效估计。有时可以用一个先验汾布来总结前期试验的信息/数据得到一个药物疗效的初始估计因为前期试验的信息/数据不够充分或有其他的不确定性,其本身不能够得箌一个准确和可靠的疗效估计需要在目前的试验中收集更多的数据。根据新收集的数据对疗效的初始估计(先验分布)进行更新并得箌一个新的估计(后验分布)。用贝叶斯方法得出的疗效估计常可视为前期试验的信息/数据和目前试验的数据以某种特定方式而做出的加權平均即如果没有目前试验的数据,疗效估计就会全部基于前期试验的信息/数据;如果有目前试验的数据疗效估计就是一个加权平均。目前试验的数据的权重会随着其数据量的增加而加大并向1趋近。

本指导原则中讨论的使用基于频率理论的适应性设计大都可用于贝叶斯适应性设计由于贝叶斯方法在统计推断中使用了前期或相关的信息/数据,在某些方面它自然有其优越性贝叶斯方法的灵活性是可用┅些统计模型来借用相关的数据。在很多情形下独自进行一个达到合适样本量的临床如何确定样本量试验会比较困难,若用贝叶斯方法來借用相关的数据从而得到更为可信的结论或许有其必要性例如,儿童的临床如何确定样本量试验中借用成人临床如何确定样本量试验Φ的数据;在罕见病中由于无法入组足够多的病人而借用类似的疾病适应症的数据;在某一区域没有入组足够的病人而借用相邻区域的数據;在一个非劣性临床如何确定样本量试验中借用过去试验中的数据从而减少对照组的病例数贝叶斯方法对这些借用都会给出定量的分析和解释。

尽管贝叶斯方法在某些方面具有优越性其最大的问题是统计推断的结果有不确定性。使用同样的前期试验的信息/数据和目前試验的数据若选择不同的先验分布或者即便选择相同的先验分布而使用不同的参数值,贝叶斯推断也可能得出不同的结论另外贝叶斯方法在最终的统计推断时也无公认的方法来选择决策标准。因为这些问题目前贝叶斯方法更多地用于Ⅰ期临床如何确定样本量试验中药粅剂量的探索,Ⅱ期临床如何确定样本量试验中用于选择后续研发策略Ⅲ期临床如何确定样本量试验中的期中分析时的无效性推断和一些预测分析,以及其他很多不以注册为目的的分析

由于适应性设计的复杂性以及基于频率理论的统计方法的局限性,尽管贝叶斯方法有其不足在一些设计中使用贝叶斯方法或许是一种更为合适的选择。如果使用贝叶斯方法需要有足够的前期信息/数据、文献和研究以支歭所使用的统计模型的合理性,包括所选择的先验分布及各个参数值另外由于贝叶斯推断基于先验分布和参数值的选择而导致的不确定性,还需要通过大量模拟结果来说明在各种假想的有可能在实际中发生的情形下方案的实施特性,特别是要通过模拟显示试验中基于后驗概率所定义的决策标准是否合理例如可用对应于基于频率理论的统计方法的整体I类错误率来衡量所选择的决策标准。再者还要考虑使用贝叶斯方法在实际中的可行性,例如如何向研究者解释各种统计模型的意义基于后验概率所定义的决策标准的意义,药物疗效估计嘚解释基于不等应答适应性概率的随机分组是否给受试者带来额外的安全性风险,以及更新应答适应性概率所带来的延迟是否会使入组嘚实际操作变得极其困难等问题这里的应答适应性概率是指根据已入组的病人的数据计算出的各个试验组的疗效,并以此概率来重新更噺未来病人的随机入组的比例

鉴于贝叶斯方法中面临的许多挑战,若采用贝叶斯方法需要仔细和慎重考虑以上所讨论的各种问题,事先做好研究和规划

基于模拟方法的适应性设计是指在适应性试验中,基于模拟方法考察所做统计推断的合理性在临床如何确定样本量試验中,统计检验是在统计假设下基于某个分布理论或近似的正态分布理论而做出的统计推断这些分布理论或近似的正态分布理论所要求的条件在传统的临床如何确定样本量试验中一般都会得到满足。为了适应药物研发的需求许多新颖、复杂的试验设计不断出现,例如主方案试验同时涉及多个目标人群、多个假设、多个终点或多重检验这对推导统计检验的分布理论提出了新的挑战。在很多极其复杂的試验中基于分布理论的条件有可能不再满足,因此借助模拟方法来建立统计推断所需要的依据经常是唯一的选择

统计模拟试验的最大優点是在假设的临床如何确定样本量试验情形下能更好地了解试验特性。具体到临床如何确定样本量试验的模拟重要的是,怎样选择模擬的模型和参数使其尽可能合理地描述试验在实际中发生的情形并能够控制整体I类错误率。因为有很多关于统计模拟的文献可供参考其涉及的模拟方法、计算机语言、模拟软件、模拟误差的控制等诸多计算细节就不在此一一讨论。

若无明确的分布理论依据通过模拟方法来证明临床如何确定样本量试验中统计检验的整体I类错误率能在零假设下完全得到控制从理论上来说是不可能的。整体I类错误率涉及整個零假设空间即假设试验和对照药物疗效相同,这从理论上来说有无穷的可能性故任何一个模拟都无法穷举所有的情形以便验证。怎樣在模拟中排除一些明显不合理的情形使其更符合实际则需要从疾病特征和历史数据来考虑,并使基于缩小的零假设空间的模拟结果从統计角度仍具有可靠性另外在模拟时,除了考虑怎样选择主要参数外还要考虑滋扰参数、入组率、脱落率/删失率、随访时间和模拟的准确率等诸多其他因素。在选择这些参数后再加入适应性设计中涉及的各种修改,以及有可能涉及的多个目标人群、多个终点和多重检驗以便显示所提出的统计方法在临床如何确定样本量试验中经过多重调整后的I类错误率仍可得到控制。

鉴于基于模拟方法的统计推断具囿不确定性除非应用的适应性设计非常有必要,并且比传统的临床如何确定样本量试验确有很大的优势否则需要综合各个方面的因素洅进行慎重地选择。如果有充足的医学文献、前期的数据等证据显示应用适应性设计具有必要性并且可靠的模拟方法、模拟结果显示适應性设计确实具有很大的优越性,则可以考虑一个基于模拟方法的适应性设计

五、 监管的考虑

鉴于适应性设计的复杂性,申办方应在设計试验时及早与监管部门沟通以便争取更多的时间用来完善方案。

(一)与监管部门的沟通

对于以探索性研究为目的的适应性设计不┅定需要与监管部门沟通交流。但是若试验有可能影响很多受试者的安全性,如病例数较大的主方案试验;或试验的早期以探索性研究為目的但晚期有可能演化成以确证性研究为目的,则有必要与监管部门进行沟通交流通常以确证性研究为目的的适应性设计都应与监管部门提前进行沟通交流,以便在设计早期有充分的时间考虑监管部门的建议、顾虑或意见尤其是对于复杂或采用了全新方法的设计。凣经备案的与监管部门达成的一致意见应反映在修订的试验方案中

(二)对申报资料的要求

申办方准备递交的资料应包含所有用来支持采用适应性设计的理论、文献和数据以便监管部门审评。资料的准备应主要围绕预先设定的调整计划充分论述医学意义、合理性、完整性和可行性。

医学意义是判断采用适应性设计是否合适的重要因素申报资料中应包含用来支持调整后试验结果仍然具有医学意义的充分證据。比如在经过一次或多次调整后,对试验结果的解释有可能变得非常困难或者试验结果最终达到统计学阳性但无医学意义。

合理性主要针对的是统计方法最重要的判断标准是所使用的统计方法能否将整体I类错误率控制在双侧0.05(或单侧0.025)的水平。申报资料中应包括預先设定的调整计划所有调整的程序和细节,以及所引用的全部文献如果适应性设计极为复杂且无具体的理论公式,可能需要通过模擬方法来说明申办方在计划时需要考虑模拟结果能否经过第三方独立的验证。

完整性考虑的是试验的操作和执行判断标准是所使用的設计不会因操作或执行引入偏倚。申报资料中应包含所有操作流程特别是怎样设定防火墙以保证分析结果不被泄露。对于数据监查委员會负责的适应性调整可参考其他相关的指导原则。

可行性旨在评估试验可能要做的适应性修改能否在实际中实施这一点需要申办方做絀综合判断。

以上只是申报资料应该包含的基本内容如果申办方认为还有其它资料有助于与监管部门的沟通交流,也可一并申报递交

原则上,适应性设计中的修改计划必须在临床如何确定样本量试验开始前的试验方案和统计分析计划中预先设定一般来说不建议对试验進行非预先设定的修改。但在临床如何确定样本量试验的操作实践中基于本试验中的数据提示需要对试验进行非预先设定的修改,此时應经过谨慎考虑后在保证不破坏试验的合理性、完整性及可行性的前提下对试验做出合理的修改并需提前与监管机构进行沟通确认。此外基于外部数据对于一个进行中的临床如何确定样本量试验做出某些修改,并不属于适应性修改而是通过试验方案的修正案来体现,通常需与监管部门进行沟通根据外部数据对试验方案进行修改的情形有很多,例如某试验中对标志物为阴性的病人药物毒性太大或者哃一类药物刚完成的试验显示仅对标志物为阳性的病人有效,需要修改目标人群仅为阳性病人;同一类药物刚完成的试验显示某主要终点嘚选择不合适或新发布的相应指南对主要终点另有定义,需要修改主要终点;新的标准治疗的改变需要修改标准治疗的对照组,或因無法继续入组病人而需要提前终止试验申办方尤其要注意这些修改是仅基于外部数据,而非基于进行中的试验本身的结果

1. CDE. 临床如何确萣样本量试验数据监查委员会的建立和实施指导原则. 2020

期中分析(Interim analysis):是指在试验期间使用试验累积数据进行的任何分析。同一试验中可鉯设计有一次或多次期中分析。

适应性设计(Adaptive design):按照预先设定的计划在期中分析时根据试验期间累积的数据对试验做出相应修改的临床如何确定样本量试验设计,这种修改又称为适应性修改适应性修改计划必须在临床如何确定样本量试验开始前的试验方案和统计分析計划中预先设定。

合理性(Validity):适应性设计的合理性是指所采用的统计分析方法不会导致疗效的估计产生偏倚试验的合理性是关于试验結果的可信度、可解释性和说服力。

完整性(Integrity):适应性试验的完整性是指对试验操作所引入偏倚的良好控制保持试验的完整性意味着按照预先设定的方案进行修改和保持期中分析结果的盲态,以求最大限度地减少操作偏倚

可行性(Feasibility):适应性试验的可行性是指试验的適应性修改能否在实际中实施。

成组序贯设计(Group sequential design):是指方案中预先计划在试验过程中进行一次或多次期中分析依据每一次期中分析的結果做出后续试验的决策。

盲态/非比较分析方法(Blinded/Non-comparative analysis):是指期中分析时不使用实际试验分组信息或者虽然已知实际试验分组信息,但未莋任何涉及组间比较的分析如在期中分析时对两个治疗组的数据合并后做的汇总分析。

非盲态分析/比较分析方法(Non-blinded/Comparative analysis):是指期中分析时使用试验分组信息(包括各组的真实名称或可区分的分组代码)的分析分析内容涉及组间比较。

两阶段无缝适应性设计(Two-stage seamless adaptive design):是指将一個试验分为两个阶段在第1阶段结束时进行期中分析,依据预先设定的判断标准对第2阶段的试验进行适应性修改。

适应性富集设计 (Adaptive enrichment design):是指试验第1阶段结束后根据期中分析结果,依据预先设定的标准对目标人群进行适应性调整以决定第2阶段的目标人群。

主方案试验设计(Master protocol design):是指一个整体临床如何确定样本量试验方案含有多个子方案不同的子方案可同时检验一种药物对于多种疾病的临床如何确定样本量效果,也可同时检验多种药物对于一种疾病的临床如何确定样本量效果或者同时检验多种药物对于多种疾病的临床如何确定样本量效果。

多重适应性设计(Multiple adaptive design):是指一个试验中采用两种或两种以上适应性调整方法的试验设计

贝叶斯方法(Bayesian method):是一类统计方法,它根据貝叶斯原理将一个分布函数(先验分布)总结的前期试验的信息/数据和目前试验中得到的数据结合在一起从而得到一个用来总结这些信息/数据的新的分布函数(后验分布),并基于此后验分布函数做出统计推断的方法

贝叶斯适应性设计(Bayesian adaptive design):是指一个使用了贝叶斯方法並同时含有适应性调整的试验设计。

基于模拟方法的适应性设计(Simulation-based adaptive design):是指在适应性试验中基于模拟方法考察所做统计推断的合理性。

附录2、适应性设计案例

示例中涉及的各种试验设计内容、统计方法选择以及具体参数设置仅为便于简洁阐述设计要点,并不具有普遍适用性囷全面性

示例1:成组序贯设计试验

假想一个多中心、随机、双盲、阳性药平行对照的III期优效性临床如何确定样本量试验,目的是验证试驗药对某适应症的症状改善效果主要终点是治疗52周时某连续型变量较基线的变化值,并可假设该变量近似服从正态分布

试验采用成组序贯设计,期中分析计划为:在入组n1例受试者时进行第一次期中分析(安全性分析)n2例时进行第二次期中分析(无效性分析),n3例时进荇第三次期中分析(有效性或无效性分析)

基于上述设计,根据预期的效应参数(如两组变化值的均数及共同标准差)、检验效能(如 90%)、各组分配比例、设定的整体I类错误率水平(如单侧0.025)及相应的控制方法等可计算出试验所需的总样本量,并制定三次期中分析的决筞策略如下:

1) 第一次期中分析时由独立数据监查委员会(DMC)综合分析安全性数据,如果DMC认为试验药物存在较严重的安全性问题可建議终止试验。此次期中分析仅以安全性为目的因此无需进行α调整。

2) 第二次期中分析时考察对照组的主要终点变化值相较于试验组昰否更优,若对照组较优则因试验药物无效性提前终止试验。此次期中分析仅考察无效性不涉及有效性判断,因此无需进行α调整

3) 第三次期中分析时,采用非绑定边界方法将针对试验药物疗效的统计检验所得P值与两条边界进行比较,边界值的确定基于某一αβ嘚消耗函数方法如果P值小于下边界, 则以有效性提前终止试验;如果P值大于上边界, 则由DMC经综合考虑后提出试验终止或继续进行的建议;如果P值在上下界值之间,则试验继续进行

示例2:盲态下样本量重估

假想一个随机、双盲、安慰剂平行对照的III期优效性临床如何确定样本量試验,主要终点为访视第4周时某量表评分相对于基线的变化值并假设其近似服从正态分布。预期试验组与对照组主要终点指标之差的总體均数为6.0标准差为10.0,设定名义检验水准为单侧0.025检验效能为90%,采用两组平衡设计求得总样本量为120例(每组60例)。假设20%的脱落率则初始设计的总样本量为150例。考虑到将参数标准差预设为10.0可能不准确故计划利用期中分析时进行样本量重估。

期中分析计划为:在完成或中圵试验的受试者达到约50%初始样本量时进行盲态下期中分析计算累积数据的合并标准差,若求得的合并标准差大于原假定的10.0则根据此参數重新估算最终的总样本量,估算时其它参数与初始假设保持一致;若求得的合并标准差小于10.0则样本量保持150例不变。根据期中分析重估嘚样本量或原始样本量继续入组受试者直至试验结束,不对I类错误率进行调整假设进行期中分析时求得的合并标准差为13.66,根据标准差為13.66均数与初始设计一样为6.00,重新计算的样本量为220考虑20%的脱落率,则总样本量重估为275例

示例3:非盲态下样本量重估

假想一个多中心、隨机、双盲、阳性药平行对照的III期优效性临床如何确定样本量试验。主要终点是24周时某标准分数较基线的变化值并假设其近似服从正态汾布,疗效分析采用Z检验根据试验预期参数(如两组样本均值之差为δ0,标准差σ=1)和其它所需要素(如α=0.025检验效能1-β=90%),确定初始總样本量为N

假设计划在完成n1例时进行期中分析并重新估计样本量。用n2=N-n1表示初始设计下第2阶段的样本量而根据期中分析组间比较结果求嘚的第2阶段所需样本量表示为n2*,则n2*-n2即是需要增加的样本量N*表示增加后的总样本量。

n2*的确定需要采用合理的适应性修改方法由于不同的適应性修改方法各有优劣,且有些方法在某些条件下可能是其它方法的特例因此难以将方法进行明确划分,具体选用哪种方法应根据具體试验目的、假设和分析方法而定也可以选择模拟分析的方法。以下简略地介绍这些常用方法的设计要点需注意,鉴于研发费用的限淛很多方法在计算时会设置样本量上限;而考虑到最小检验疗效的临床如何确定样本量意义,也有很多方法在计算时对其进行了考虑鉯下介绍并未将这两点因素考虑在内。

zone)方法:根据期中分析结果计算条件检验效能CP(Nz1),并将其分为三个区域即,和z1为仅基于第1阶段n1唎数据得出的Z统计量。若CP(Nz1)≤,可终止试验;若CP(Nz1)≥,可继续试验;若<CP(Nz1)<重新估计样本量:在满足CP(Nz1)>50%时,样本量的重新估计不会增加I类錯误率对于样本量的重新估计,可利用期中分析所得两组疗效之差代入样本量计算公式计算新的样本量N*,使之满足CP(N*z1)=1-β。最终分析时基于调整后样本量N*计算Z检验统计量与z1-α(不需要调整)进行比较以判断其有效性。

2)加权统计量方法:也可视为一种逆正态分布组合函數方法但更简便。根据期中分析结果基于某种标准(如条件检验效能)计算出调整后样本量N*。令,则最终的检验统计量为Z*=w1Z1 + w2Z2*并与z1-α(不需要调整)进行比较,这里Z*服从标准正态分布,Z1为仅基于第1阶段n1例数据得出的Z统计量Z2*为仅基于调整后第2阶段n2*例数据得出的Z统计量。需注意上述权重的计算基于试验初始设计的n1n2但这类加权统计量方法也可以只指定n1而不需要确定初始总样本量N

3)极大似然比方法:設定拟达到的目标CP(N*z1)值,据此调整拒绝域的临界点c其由公式决定 (式中和分别表示标准正态分布的累积分布函数和概率密度函数),这裏z1<kk基于所选α消耗函数方法(若有有效性检验)决定。最终分析基于调整后两阶段的样本计算Z统计量并与调整后的临界点c进行比较。

4)条件误差函数方法:选择满足一定条件的递增函数A(z)记zA-1(1-A(z1)), 则n2*=2(zA+zβ)212,δ1是期中分析所得疗效估计值zβ是标准正态分布的上β分位数,则n2*-n2即是需要增加的样本量最终分析利用调整后第2阶段病例计算的Z2*值与进行比较,判断有效性

是基于期中分析数据估计的疗效值。基于n1n2*汾别计算两个阶段的Pp1p2p1 + p2与 0.2236 进行比较,判断有效性此方法要求期中分析数据所得的疗效估计值δ1不能与初始设定的δ0反方向,且不能减少样本量

示例4:两阶段无缝II/III期适应性设计试验

假想一个验证某新药用于改善某症状的多中心、随机、双盲、阳性药平行对照、优效性临床如何确定样本量试验,主要终点是第8周时某种分数较基线的变化值并假设其近似服从正态分布。计划采用两阶段无缝II/III期的适应性設计II期试验包含两个药物组(高和低剂量)和一个对照组,随机分组率为1:1:1, 预期疗效为两组受试者间平均改进分数差值δ设定单侧α=0.025和檢验效能1-β(如 90%),计算出一个剂量组和对照组比较的样本量N试验的第3n1个受试者完成8周随访后第1阶段结束,总样本量为N+n1(两比较组总受試者数N加未选上剂量组在第1阶段的受试者数n1

对于第1阶段,令p11p12分别表示低剂量组vs.对照组(零假设为H011:低剂量组与对照组无差别)和高剂量組vs.对照组(零假设为H012:高剂量组与对照组无差别)Z检验的P值结果采用闭合方法和Hochberg方法进行多重性调整,则检验低、高剂量组与对照组均無差别(H011∩H012)的P值是pint1=

对于第2阶段入组病例数为原定两组样本量N减去第1阶段两组受试者数2n1,即N-2n1将入组病例随机分配至选定的剂量组和对照组。试验终止时分别根据第1阶段和第2阶段的受试者计算各阶段P值,分别记为p1q采用逆正态组合检验,计算并与α=0.025进行比较判断有效性,这里权重w1等于第1阶段三个组的受试者例数相对于试验入组总例数之比的平方根即;权重w2等于第2阶段两个组的受试者例数相对于试驗入组总例数之比的平方根,即

示例5:适应性富集设计

假想一个多中心、随机、双盲、阳性药平行对照、优效性两阶段临床如何确定样夲量试验。主要终点为总生存期(OS)次要终点为无进展生存期(PFS)。假设全人群中风险比HR(F)为0.75阳性亚组中风险比HR(S)为0.55。设定检验水准為单侧0.025检验效能为 90%,并根据其它所需参数计算出在全人群中所需要的总死亡数为N0

试验计划在入组40%时利用期中分析进行目标人群选择。甴于该试验受试者总生存期较长故用PFS作为期中分析时目标人群选择的依据,决策策略为:①如果估计的HR(F)<0.85且HR(S)<0.65第2阶段在阳性亚组囷全人群中继续试验;②如果HR(F)≥0.85且HR(S)<0.65,第2阶段仅入组阳性亚组;③如果HR(F)<0.85且HR(S)≥0.65第2阶段继续在全人群中试验,且不对阳性亚組进行分析;④如果HR(F)≥0.85且HR(S)≥0.65则以无效性终止试验。

和H0F∩H0S在两个阶段对应的P值对组合检验H0F∩H0S使用逆正态组合函数和闭合方法,鈳将整体I类错误率控制在单侧0.025水平如采用Simes方法,则检验(H0Fn1n2是分别表示两阶段的死亡病例数在最终分析时,检验H0F∩H0S  P值为C(p1FS, p2S)来检验洅基于闭合方法,若同时拒绝H0F∩H0S和H0F则可最终拒绝H0F;若同时拒绝H0F∩H0S和H0S,则可最终拒绝H0S

对于该试验,如果第1阶段的检验基于PFS而第2阶段的检驗基于OS则最终计算出的两阶段P值涵义难以解释,因此试验设计为第1阶段的决策基于PFS的描述性统计量结果,而最终计算两阶段P值时则均基于OS的P值结果对于以生存期为终点的试验,无论第1阶段入组受试者的终点事件发生在哪个阶段计算时均应将其归在第1阶段的结果内,否则两阶段的独立性假设将不再成立,导致I类错误率增加

示例6:适应性主方案试验

假想一个验证新药治疗有BRAF V600E正突变的罕见癌症患者的優效性临床如何确定样本量试验,主要终点是经独立终点委员会确认的客观缓解率并有持续缓解时间的记录。采用多中心、单臂篮式设計试验入选受试者必须是经中心试验室确诊具有BRAF V600E突变的晚期病例,包括5个队列分别是间变性甲状腺癌、胆道癌、胃肠道间质瘤、毛细胞白血病和小肠腺癌。

在此试验中虽然所有受试者按照同一个方案入组,但5个队列中的每一个队列都可被视为一个独立的试验其结果嘟可单独用来支持相应队列的申报。由于试验目的是支持新药申报因此必须事先确定样本量,应该根据优效性的决策规则分别计算每一隊列所需的样本量对于将两个或多个队列数据合并申报的考虑,由于本试验缺乏足够数据支持试验药对具有BRAF V600E正突变的患者有同样的作用機理和相似疗效因此,将任意两个或多个队列数据合并以支持对应合并队列新药申报的做法是不被接受的

点击文档标签更多精品内容等伱发现~


VIP专享文档是百度文库认证用户/机构上传的专业性文档,文库VIP用户或购买VIP专享文档下载特权礼包的其他会员用户可用VIP专享文档下载特權免费下载VIP专享文档只要带有以下“VIP专享文档”标识的文档便是该类文档。

VIP免费文档是特定的一类共享文档会员用户可以免费随意获取,非会员用户需要消耗下载券/积分获取只要带有以下“VIP免费文档”标识的文档便是该类文档。

VIP专享8折文档是特定的一类付费文档会員用户可以通过设定价的8折获取,非会员用户需要原价获取只要带有以下“VIP专享8折优惠”标识的文档便是该类文档。

付费文档是百度文庫认证用户/机构上传的专业性文档需要文库用户支付人民币获取,具体价格由上传人自由设定只要带有以下“付费文档”标识的文档便是该类文档。

共享文档是百度文库用户免费上传的可与其他用户免费共享的文档具体共享方式由上传人自由设定。只要带有以下“共享文档”标识的文档便是该类文档

还剩5页未读, 继续阅读

我要回帖

更多关于 临床如何确定样本量 的文章

 

随机推荐