他山之石 | 抗肿瘤药物和生物制品临床试验终点的指导原则--中国食品药品网

他山之石 | 抗肿瘤药物和生物制品临床试验终点的指导原则

2021-02-01 15:12
作者：
来源：中国食品药品网

　　本指南给申请人就向 FDA 提交肿瘤临床试验终点方面提供建议，以支持其满足新药上市申请（NDAs）、生物制品上市许可申请（BLAs）或补充申请时的有效性评价要求。同时本指南也提供了背景信息，讨论了一般性法规原则。其中讨论了用于治疗癌症患者的药物终点。本指南就用于预防或降低癌症发生率药物的终点不进行讨论。

　　临床研究终点服务于不同的研究目的。在传统的肿瘤药物研发中，早期的临床试验用以评价安全性以及炎症药物的生物活性，如肿瘤缩小。后期的有效性研究通常对药物所提供的临床效益进行评价，例如生存期延长或症状改善等。以下章节将讨论一般性法规要求的有效性以及抗癌药物审批过程终点的选择会产生什么影响。后面的章节详细描述了这些终点，并讨论了在不同的临床试验中，它们是否可以作为病情发展或临床获益的测量指标。

　　关于有效性的法规要求

　　对新药有效性的要求是以《联邦食品药品和化妆品法》1962 年修正案为基础的。该法案要求提供可靠证据证明药物的有效性，而且规定这些证据必须来自合适且具有良好对照的临床研究。同样《公众健康服务法》也要求生物制品必须符合安全、纯度和效价的要求。以往用于支持药物批准的临床获益包括重要的临床结果（如生存期延长和症状改善）以及对已确立的替代终点（如血压和血清胆固醇）的影响。

　　1992 年公布的加速审批法令（美国联邦法规第 21 卷第 314 部分H 分部，以及美国联邦法规第 21 卷第 601 部分 E 分部）规定，用于治疗严重或威胁生命的疾病、对现有治疗有所改进或填补某种疾病治疗空白的药物或生物制剂，其审批可以采用其他终点。据此，FDA 可能同意采用能够合理预测临床获益（基于流行病学、治疗学、病理生理学或其他证据）的替代终点批准药物的申请。这些替代终点不同于常规使用的经过充分验证的替代终点（如心血管疾病中的血压或胆固醇）。如果药厂通过统一进行的临床试验来证实或体现药物的实际临床获益，则此药物可以通过加速审批法令审批上市。如果上市后研究不能证明其临床获益，或者申请者在必要的研究中存在差错，则需要通过快速程序将药物撤市。在下文的讨论中，“常规审批”指在证明临床获益的基础上而进行传统耗时较长的药品审批途径。而“加速审批”则与之不同，指使用能够合理预测临床获益的替代终点而进行的快捷审批途径。

　　包括临床试验最佳数量在内的支持药物审批的关键证据，在 FDA批准已上市的用于新的肿瘤治疗药品行业指南以及 1997 年的FDA 现代化法中进行了讨论。大多数情况下，FDA 建议至少有两个充分的、具有良好对照的临床试验。某些情况下，单个临床试验提供的证据也可以（例如：一个多中心研究已提供高度可信、有效且论据充分的统计，以及重要的临床获益证据，如对生存期的影响，那么从实践和伦理学的角度来看，则无法经第二个临床试验对结果进行验证）。如果药品已批准用于某一恶性肿瘤的某个特定治疗期，那么在对此类肿瘤进行分期治疗时，一个临床试验的数据就足以对其有效性进行补充说明。

关于临床试验终点的一般性考虑

　　本部分回顾了抗肿瘤药物研发中的一般性问题。对常用的抗肿瘤药物临床试验终点进行了探讨，并对采用这些终点的肿瘤临床试验设计中的相关问题进行了讨论。本部分中将讨论的临床试验终点包括总生存期（overall survival ,OS）、基于肿瘤测量的终点如无病生存期（disease － free survival ,DFS）、客观缓解率（objective response rate, ORR）、完全缓解（complete response, CR）、疾病进展时间（time to progression ,TTP）、无进展生存期（progression-free survival ,PFS）和基于症状评价的终点。抗肿瘤药物审批所用的重要临床试验终点比较见表 5-1。

5-1

　　总生存期

　　总生存期定义为从随机化开始到因各种原因导致患者死亡的时间，且是按意向治疗人群（ITT）计算。这个终点精确可测，并有死亡日期提供依据。在终点评估时不会出现偏倚。生存期是迄今为止评价抗肿瘤药物最可靠的临床试验终点，当研究能充分评价生存期时，它通常是首选终点。

　　总生存期应在随机对照研究中予以评价。对于这类时间依赖性终点（例如 OS、PFS）的历史研究数据可信度较低。历史研究中的对照组和当前治疗组间除使用的药物治疗不同外，还包括病例选择、影像技术和治疗技术改善等其他因素的差异，这都将导致结果出现显著差别。随机化研究通过进行直接结果的比较，将这些差别最小化。如果药物的毒性在可接受范围内，则总生存期的显著改善便可视为是具有临床意义的，通常其能够支持新药的上市审批。

　　大型试验的随访期较长以及后续的抗肿瘤治疗导致生存期分析的混淆是生存期研究实施和分析中存在的困难。

　　基于肿瘤测量的临床试验终点

　　本部分将对几种基于肿瘤测量的临床试验终点进行讨论。这些终点包括无病生存期（DFS）、客观缓解率（ORR）、疾病进展时间（TTP）、无进展生存期（PFS）和治疗失败时间（TTF）。所有时间依赖性终点数据的收集和处理均基于间接的评价、计算或估计（如肿瘤的测量）。

　　当选择基于肿瘤测量的临床试验终点时，应针对该终点在抗肿瘤药物临床获益评价中的不确定性和偏倚进行评估。在不同的肿瘤试验中，研究者对肿瘤测量的精密性相差甚远。此外，如果肿瘤不存在明确的界限（例如恶性间皮瘤、胰腺癌和脑瘤），那么使用肿瘤测量方法获得的缓解率可能是不精确的。药物申请上市时，如果采用基于肿瘤测量的临床试验终点作为其有效性评价的唯一证据，那么通常需要提供第二组试验的数据予以说明。

　　如果主要研究终点的选择基于肿瘤测量终点指标（如 PFS 或ORR），通常应由研究治疗中处于盲态的独立终点审查委员对其终点指标进行评价。如果试验本身未设盲时，这种由独立的第三方进行的盲态下的测量特别重要。FDA 可能会抽检部分资料来核实独立终点审查委员会的审阅程序。当随机研究采用盲法（除非发生不良事件使得研究实际上已被揭盲），或在大型随机研究中其效应量较为稳定，并且敏感性分析未发现观察者的偏倚（尤其是针对 DFS），那么基于肿瘤测量的终点指标评价（尤其是 PFS或 DFS）可无需进行集中独立审核。

　　无病生存期

　　无病生存期（DFS）通常定义为患者从随机分组开始，到其肿瘤复发或由其他原因引起死亡的这段时间。该终点最常用于彻底手术或放疗后的辅助治疗的研究。如果某些疾病（如血液肿瘤）在大部分患者化疗后能够完全缓解，则 DFS 也可以作为一个重要终点。尽管在大多数辅助治疗的情况下，总生存期仍是一个传统的终点指标，但当生存期延长而使得选择生存期作为临床试验终点显得不现实时，DFS 可以作为一个重要的终点指标。目前 DFS 已经成为乳腺癌辅助性激素治疗、结肠癌辅助治疗以及乳腺癌辅助性细胞毒治疗的主要审批基础。无病生存期可以是临床获益的替代终点，也可以为临床获益提供直接证据。这一决定取决于疗效的大小、风险 - 效益的关系以及疾病的情况。

　　如果将 DFS 作为可能终点，则需要着重考虑预期疗效和已经证明的标准治疗方法的收益。试验方案应详细说明 DFS 的定义以及随访研究和时间的安排。许多原因都会导致计划外评价，因此各试验组之间计划外评价的频率、时间和原因存在差异，而这些差异可能会导致偏倚。必要时可采取研究者和患者双盲的操作，使这种潜在的偏倚最小化。可以通过对随访期间事件发生的总数（不管事件发生的时间）进行比较分析，从而评估由于计划外评价而产生的可能偏倚的影响。

　　无病生存期的定义可能比较复杂，尤其是当死亡已发生而却没有预先对肿瘤演变情况进行记录时。这些事件可记录为疾病复发或视为审查事件。尽管所有关于死亡的统计分析方法均有一定的局限性，但将所有致死原因均归结于疾病复发则可以将偏倚降至最低。这种定义的局限性在于高估了 DFS，尤其是对于长期失访后死亡的患者。如果在各研究组中，由于长期随访的频率不一致或因药物毒性而故意去终止，这将会产生偏倚。某些分析将与肿瘤相关的死亡认为是 DFS 事件，并删去了非癌症死亡病例，这种方法可能在判断死亡原因时产生偏倚。另外，任何删失患者的方法（无论是针对死亡还是末次随访）表明删失患者与未删失患者都具有相同的复发风险。

　　客观缓解率

　　客观缓解率（ORR）是指肿瘤缩小达到预定值并且保持一定时间的患者比例。缓解期通常是指从开始出现疗效直至证实出现肿瘤演变的这段时间。FDA 一般定义客观缓解率为完全缓解与部分缓解之和。采用这种定义后，客观缓解率是一种直接衡量药物抗肿瘤活性的指标，可以在单臂试验中进行评价。疾病稳定不是客观缓解率的组成部分。疾病稳定可以反映疾病的自然进程，而肿瘤缩小则是直接疗效。同样，疾病稳定可通过 TTP 或 PFS 分析进行更精确的评价。必要时可采用标准化指标以确定其疗效，如RECIST 标准。缓解标准应在试验开始前的方案中定义。客观缓解率的评估包括缓解程度、缓解持续时间以及完全缓解率（肿瘤检测未能发现）。

　　疾病进展时间和无进展生存期

　　疾病进展时间（TTP）和无进展生存期（PFS）视为药品审批的初始终点。TTP 定义为从随机分组开始至出现肿瘤客观演变的时间；TTP 不包括死亡。PFS 定义为从随机分组开始至出现肿瘤客观演变或死亡的时间。关于肿瘤演变的明确定义非常重要，应在方案中进行详细描述。

　　TTP 和 PFS

　　与 TTP 相比，PFS 是更常选用的替代终点。因为 PFS 包括死亡，其能够更好地反映受试药物的毒副作用，因此与总生存期有更好的相关性。在 TTP 的分析中，无论在死亡时还是在相对较早的随访期间，死亡病例均存在删失（试验中故意去终止）现象。而PFS 可假设患者的死亡与肿瘤演变有未知的联系。然而，当大多数死亡与癌症无关时，TTP 也可作为合适的终点指标。

　　PFS 作为支持药物审批的终点

　　表 5-1 列出了用 PFS 作为支持抗癌药物审批终点的优点和缺点。PFS 既能够反映肿瘤的生长，又可在生存益处确认前进行评价，且不会受到后续治疗的混淆。至于预期样本量，PFS 受到的影响大于总生存期受到的影响。然而对于许多不同种类的恶性肿瘤来说，正式以 PFS 作为总生存期的替代终点比较困难，通常没有足够的数据对生存期和 PFS 的相关性进行评价。抗肿瘤药物临床试验规模通常较小，已有药物的生存收益通常比较小。在不同的抗肿瘤治疗试验中，用于支持审批的 PFS 终点所起的作用是不同的。无进展生存期的延长能否直接代表临床收益或仅是临床收益的替代终点，取决于这种新治疗方法的疗效大小以及与现有治疗相比的风险 - 效益比。

　　PFS 试验设计问题

　　在试验方案和统计分析计划（SAP）中应详细描述评价、测量和分析 PFS 的方法学。同样，在试验方案中仔细对肿瘤进展标准进行定义也很重要。现在还没有法定标准对肿瘤进展作出定义，申请人需要使用不同的标准，包括 RECIST 标准。除了公认的 PFS 标准中列出的大纲，试验方案和统计分析计划也应增加其他细节。在两个试验组中，随访和影像学评价必须相互均衡，以避免系统偏倚。研究应尽量采用盲法。如果将患者或研究者评价作为演变终点的一个因素，则设盲显得尤其重要。其至少应由盲态独立裁定小组（independent adjudication team，一般包括影像学家和临床医师）进行评价。FDA 和申请人应在以下方面提前达成一致意见：

　　●研究设计；

　　●疾病进展的定义；

　　●记录在 CRF 表上的数据；

　　●统计分析计划（SAP）；

　　●缺失数据的处理办法和数据删失办法；

　　●如适用，独立终点审核委员会（IRC）的操作规程。

　　PFS 的分析

　　由于有数据缺失等现象，PFS 分析变得比较困难。试验方案中应针对每位患者对“一个充分的评价随访（即，在此次随访中完成了所有既定的肿瘤评价）”给予定义。分析计划应总结比较各治疗组的随访充分性。方案应详细说明如何分析不完整和 / 或缺失的随访数据，以及数据删失的方法。分析计划应明确说明主要分析，以及一个或多个敏感性分析，用来评价结果的可靠性。虽然所有含缺失数据的分析都存在一定问题，但只要敏感性分析和主要分析都能支持结论，那么结果就是正确的。评价中应包括长期失访患者的死亡人数。这类死亡会高估随访较少组的 PFS，进而导致 PFS 的测定产生偏倚。

　　由于可以从多时间、多途径获得病情进展数据（包含计划外随访的身体检查和各种类型的影像学扫描），因此每次对随访收集数据要在随访前后固定较短时间内进行评价。如果收集数据时间较长，则难以确定事件和删失日期。建议：如果之前不存在缺失的评价，则将最早观察到的病情进展时间定为进展日期，并将确定无病情演变的末次影像学评价日期定为截止日期。建议在Ⅱ期临床试验结束后与 FDA 就 PFS 数据的收集和分析计划进行讨论，并在专门的方案评估时进行核实。

　　治疗失败时间

　　治疗失败时间（TTF）是一个复合的终点指标，即从随机化开始到由其他任何原因（包括疾病进展、治疗毒性和死亡）导致治疗终止的时间。一个合理的支持审批的终点指标应当能清楚地将有效性和药物毒性、患者或医师戒断以及患者不耐受区分开。

　　基于症状评价的临床试验终点

　　症状和体征的改善通常被认为是临床治疗效果收益，如体重的增加、疼痛的减轻或止痛药用量减少等。主要可用于对盲法、多数患者有症状、无有效治疗药物和较少影像评估的试验的疗效评价。在非盲法试验中，容易受到主观因素的影响而导致结果偏倚。当以症状和体征的改善作为支持抗肿瘤药物审批的主要终点时，应当能够对肿瘤相关症状的改善还是药物毒性的减小或缺失予以区分。

　　患者自评结果（patient reported outcome ,PRO）是直接来自患者而非临床医师或其他人的关于其健康状况的报告，可作为反映疗效收益的合适评价方法。但有一定局限性，研究者和受试者报告可能存在很大差别，问卷信息收集的时间会对其产生影响，语言因素也会导致其不能被准确评估。生活质量评分（Quality of Life,，QOL）也可以用来评估与健康相关的生活质量。但应当注意，以QOL 来衡量药物的结果可能只能说明某种药物相对其他药物来说毒性较小，但并非具有更好的有效性。

　　设计合适详细的评估量表是准确评估药物作用的基础，不应只提供“出现或未出现”这样的数据。用于抗肿瘤药物临床试验效果评价的量表必须有学术界认可的可信度和效价分析。量表中各项目的评价应尽可能采用定量或等级的方式来反映观察到的变化程度，应尽可能避免采用“是或否”“出现或未出现”这样的二分类数据。

　　由于毒性或肿瘤演变而终止对受试者的评价，从而导致数据的丢失，这种情况在抗肿瘤药物临床试验中较为常见。数据的丢失会给评价带来困难。因此，试验方案中应有相应的措施能尽可能避免或减少数据的缺失。

　　特定症状终点

　　与“疾病进展时间（TTP）”相似，“癌症症状演变时间（time to progression of cancer symptoms）”是临床效益的直接测量指标而非替代终点。如上文所述，疾病进展测量中存在的问题（例如评估缺失）同样存在于“症状进展时间”的评估中。在非盲的试验中可能导致评价偏倚。其次，肿瘤形成到肿瘤恶化需要一段时间。在达到症状终点前，往往对治疗进行调整，从而混淆了分析结果。此外，许多抗肿瘤药物的试验选样为肿瘤病症很轻的患者，其往往很难将肿瘤相关症状和药物毒性区分。

　　复合症状终点中的某一症状指标应当具有类似的临床重要意义，其结果不应当只归因于一个指标。例如，针对基于复合终点的批准用于治疗肿瘤骨转移患者的药物，与骨骼相关的事件被定义为病理性骨折、骨放射治疗、骨外科手术和脊髓压迫。选择恰当的研究人群是证明其在症状方面有效益的关键。在研究起始时就有病症的患者，可利用症状缓解的不同程度来进行分析评价；无症状的患者，应分析其“首次发生症状的时间”。即使患者终止使用研究药物或开始使用另一种新药，如果随访持续到症状的首次出现，则仍可评价症状的进展。

　　症状数据面临的问题

　　数据缺失以及评价不充分可能使症状数据的评价更复杂，特别是对于开放性研究而言。因药物毒性或肿瘤恶化而终止研究是数据丢失的一个主要原因。理论上，当患者停止治疗时也应继续收集可供分析的信息。基于多样性考虑，应进行多种症状的前瞻性数据收集，同时需要在 SAP 中详细说明必要的统计学修正。

　　生物标志物（Biomarker）

　　尽管目前许多生物标志物已经作为临床上观察肿瘤反应和演变的监测指标，比如 CA-125 用于卵巢癌，PSA 用于前列腺癌的观察，血液和尿液中异常蛋白水平用于骨髓瘤缓解评价，但尚需要做进一步的研究来证实现有测试方法的可靠性，并确定生物标志物的改善是否能用来预测临床效益。因此，目前生物标志物不能单独作为上市批准的依据，但 FDA 接受以肿瘤标志物作为复合终点的一个指标。例如在卵巢癌患者中，伴随 CA-125 上升的某些特定临床事件（如体力状况明显下降或肠梗阻）可反映患者病情进展。此外，生物标志物还可用于确定预后因素、患者选择以及在试验设计中需要考虑的分层因素。建立保留肿瘤部分的组织、体液或血清样本等来进行相关标志物的研究检查。

临床试验设计考虑

　　依照相关法律（21CFR314.126），FDA 对新药上市的批准必须基于有效性的“充分且良好的对照研究”。研究必须与一个对照组进行比较，且就药物的疗效进行充分的评价。在盲法随机对照试验中，统计学和临床终点指标上表现出改善能够有力地证明其有效性。下面将对几个关于支持药物上市的抗肿瘤药物临床试验设计的问题进行讨论。

　　单臂试验

　　当目前没有其他治疗方法时，并且推测肿瘤明显缩小的原因可能为试验药物时，FDA 可能会接受在单臂研究中所观察到的客观缓解率和缓解持续时间作为支持审批的证据。例如在急性白血病等疾病中，可以使用缓解率作为支持审批的终点指标。因为在这些疾病中，完全缓解与输血需求量的减少、感染降的低和生存期的增加有关。考虑到各类肿瘤的自然进程变异性很大，因此单臂试验不能充分体现时间 - 事件终点，如生存期、TTP 和 PFS。所以当采用时间 - 事件终点指标时，需要进行随机对照研究。

　　非劣效性研究

　　非劣效性试验的目的是通过一个预先规定值（非劣效性界值）论证新药的疗效不低于标准治疗药物。非劣效性界值是指疗效的降低必须在临床可接受的范围内，且不得超出阳性对照药的效果。标准治疗药物必须有明确的临床效益（生存效益）。如果新药的疗效低于阳性对照药疗效，且劣效程度超出了非劣效界值，则可推断该新药是无效的。

　　非劣效性试验是基于外部（历史性）数据来确定阳性对照药物的疗效。在抗肿瘤药物试验中，通常没有充分的数据对其疗效进行描述。非劣效性试验还依赖于一个恒定的假设：历史研究和当前研究中阳性对照药的疗效是恒定的。阳性对照药的有效性来源于历史数据和当前试验，假设包括两者均具有同样的患者人群特点、治疗方法和评价方法。阳性对照药疗效的估计值应基于历史研究的全面分析。与安慰剂相比，这些研究应重新证实阳性对照药的有效性。实施非劣效性试验时，在如何评估阳性对照药疗效大小和确定需要保留的效应值（非劣效界值）方面具有一定的困难。与优效性试验相比，非劣效性试验通常需要更多的病例，同时还应考虑临床试验结果的重现性。此外，后续治疗和到阳性对照组的交叉可以干扰各种非劣效性分析。对于采用非生存期指示终点的非劣效性试验，其结果不太可靠。

　　放疗保护剂和化疗保护剂的试验设计

　　放疗保护剂和化疗保护剂是专门用于减轻放疗或化疗毒性的药物。这些药物的试验评价通常有两个目标：一是评价保护剂是否达到预期减轻放疗或化疗毒性的目的；二是确定保护剂是否阻碍抗肿瘤的疗效。第二项可采用替代终点来检验，如客观缓解率（ORR）或肿瘤进展时间（TTP），而非总生存期。

　　尽管本指南的总原则是帮助申请人选择上市申请的终点，但仍然建议申请人就相关 NDA 或 BLA 申报方案和 FDA 在上市申请前进行商谈。FDA 会指定多学科专家参加，包括肿瘤、统计、临床药理和外部专家顾问。申请人可以在讨论后对方案进行申报，同时要求 FDA 对方案进行特殊评估，以便确认用于支持药物上市申请的终点和方案设计是合格的。

　　总之，上市审批并不仅仅取决于临床试验设计，还取决于 FDA 对药物上市申请中所有研究结果和数据的审核。【摘编自《FDA药品与生物制品管理办法指南（二）》，中国医药科技出版社】

本文仅代表作者观点，不代表本站立场。

(责任编辑：李硕)

分享至

右键点击另存二维码！

返回首页>>