1 前言
临床试验的结局指标没有得到足够的重视,对这个问题的认识也不断加深。如果研究结果要影响实践和未来研究,其结局指标需要与卫生服务使用者和其他卫生保健决策者紧密相关。此外,结局指标报告偏倚,即根据结果选择纳入试验报告的结局指标,已被确定是影响发表数据解读的一个问题。
核心结局指标集(core outcome set,COS)的形成与实施,目前引起了卫生研究所有领域越来越的关注[1],并与全球范围内的研究实践密切相关。一项最新调查显示,目前一些试验者、系统评价员和指南制定者(COS 使用者)将 COS 研究作为工作中结局指标选择的起点[1]。COS 的使用可帮助提高指标测量的一致性,并能够减少结局指标报告偏倚。而报告偏倚会导致研究实施和报告过程中的大量不必要的浪费[2]。
新近一篇系统评价确认已有 200 多个发表的COS 研究[1],并且还有许多已知的在研 COS 研究[3]。COS 形成的第一步应该是“测量什么”,而“如何做”和“何时做”通常是下一步。COS 的价值在很大程度上取决于它“ 为什么做” 和“ 如何做”。COS 制定工作组的可靠性,与他们指标评价的经验和如何让主要利益相关群体参与制定过程相关,这会影响到 COS 的后续采用。此外,COS 形成研究的报告质量也影响其推行。最近研究显示,目前的报告质量参差不齐[ 4 ],限制了临床试验者、系统评价员和指南制定者等 COS 潜在用户评估与他们自己工作相关性的能力。
核心结局指标集之前被定义是健康或卫生保健特定领域中所有临床试验都必须测量和报告的,最小的、公认的、标准化的指标集合[2]。COS 正在研究用于临床试验以外的领域。尽管先前制定了关于 COS 研究中德尔菲调查的报告建议[5],但因在COS 形成过程中包含了其他各种方法和内容,故也应及时广泛收集这一领域渐增的活动共识[1]。在本文中,我们介绍了一个研究项目的结果,其目标是采用“提高卫生研究质量和透明度网络”(Enhancing
the QUAlity and Transparency Of health
Research,EQUATOR)[6]提供的方法制定 COS 形成研究的报告指南(Core Outcome Set-Standards
for Reporting,COS-STAR)。报告清单不仅关乎 COS 形成中使用的共识方法,还可以应用于有效性试验、系统评价或常规治疗的 COS 形成[7]。
2 术语
一个核心指标集描述了在特定研究或实践环境中应该测量的内容,下一步需要确定如何界定或测量每个结局指标。仅有 38% 的已发表研究中含有测量 COS 结局指标的推荐意见[4]。制定这个报告指南是为解决形成 COS 的第一阶段问题,即应该测量什么。
3 伦理审批
本研究已咨询利物浦大学伦理委员会并通过伦理批准(参考 RETH000841)。如果参与者回复了德尔菲调查或同意参加共识会议,则被认为是已知情同意。
4 COS-STAR 声明的形成
一份概述了 COS-STAR 研究中德尔菲过程的完整方案已经发表[8],包括提供一份配套的解释和阐释的文档(Explanation and Elaboration,E+E)的意向,其中给出了每个清单条目的含义和合理性。初始清单包括 48 个报告条目,产生于以前一个关于 COS 研究的系统评价,包括德尔菲调查[5]、制定 COS 的个人经验以及项目管理工作组报告(COS-STAR 工作组)。这份包括潜在报告条目的初始清单被纳入到一个国际性的两轮德尔菲调查中,以确定这些报告条目的重要性。
德尔菲调查涉及四个主要利益相关者群体,他们将参与到 COS 形成、报告和应用等方面。邀请函通过电子邮件发送到:(1)在核心指标集有效性试验数据库(Core Outcome Measures in Effectiveness Trials,COMET,www.comet-initiative.org)中已发表的 196 个 COS 研究的主要作者,并请他们将邀请函转发给参与的所有方法学家;(2)250 种发表过COS 研究和 70 种涉及女性健康(CoRe Outcomes in WomeN’s health,CROWN,http://www.crowninitiative.org/)核心指标的期刊编辑,主动支持采用COS;(3)COS 潜在用户:① 商业或非商业、在clinicaltrials.gov 数据库注册(来自 8 449 项注册试验的 20% 随机样本)的开放性 III/IV 期试验主要研究者,② 来自 53 个 Cochrane 评价小组的 76 位协调编辑;(4)33 名患者代表,先前参加过 COMET专题会和 COMET 公众与患者参与、介入或协同工作组(Public and Patient Participation,Involvement
and Engagement,PoPPIE)。邀请在指南国际协作网网站(http://www.gin2015.net/about/)上列出的临床指南制定者参与的可行性不大,因为他们是成员组织。因此调查问卷中增加了涉及临床指南制定的问题作为替代办法。目的是从每个利益相关者群体中招聘尽可能多的人员来进行德尔菲调查。给参与者发送一封个性化电子邮件,概述项目情况-类似于研究计划中的描述和 COS 研究的第一个系统评价[4]。
德尔菲参与者评价每个报告条目的重要性,方案中界定尺度从 1 分(不重要)到 9 分(至关重要)[8]。在第一轮德尔菲调查中,参与者可建议将新的报告条目纳入到第二轮调查中。在第二轮调查中,给参与第一轮的所有参与者展示每个条目的回复数量和分数分布情况,不同相关方分别提供,连同自己在内的第一轮的评分。第一轮德尔菲调查中建议增加的 9 个报告条目,也用于第二轮评分。根据前期规定[8],每个相关方至少 70% 的投票参与者评分在 7~9 分之间,则被认为达成共识。25 名 COS 制定者、107 名 COS 使用者、40 名医学期刊编辑和 11名患者代表参与了两轮德尔菲研究,其中 13 人曾参与过临床指南制定。因第二轮的反馈是按组表述的,则每个利益相关群体反馈人数变化不会影响结果。德尔菲过程运用 COMET(http://www.cometinitiative.org/delphimanager/)开发的 DelphiManager
软件进行控制和管理。两轮德尔菲研究的匿名数据,按照利益相关组逐项列出,可在“S1
DelphiData”中获取。
共识会议已于 2016 年 1 月在英国伦敦举行,为期一天,共有 17 名国际代表参加,包括 6 名 COS制定者、4 名医学期刊编辑、5 名 COS 使用者[1 名试验者、2 名 Cochrane 系统评价协作编辑和 2 名临床指南制定者]和 2 名患者代表。参会个人的遴选和邀请使用以下宽泛的原则:① 完成两轮德尔菲过程的参与者;②
四个利益相关者群体之间保持平衡;③ 使用德尔菲调查方法与使用其他方法的COS 制定者之间保持平衡;④ 试验者、系统评价员及指南制定者等 COS 使用者之间保持平衡;⑤ 合理的地理分布。最初的邀请是由作者根据他们个人的专业知识确定的。如果某个人不能参加,将尽可能地让来自相同利益相关群体的其他人来代替。
每个参与者的作用不存在冲突,综合了临床与方法学经验。会议的目的是对 57 个潜在重要的可能纳入 COS-STAR 清单的报告条目进行讨论并投票表决。3 名额外的参与者(一名推广员和两名记录员)出席了会议,但没有参加讨论或投票。所有 57 个报告条目的德尔菲结果在会前和会议期间均提供给共识会议代表(S1 Consensus Matrix
Delphi)。共识会议的幻灯片展示了每个利益相关者群体的应答率、地理分布和第二轮德尔菲结果,可在 S1
Consensus Meeting Presentation 中获取。虽然调查的回复率低,但超过 86%(183/214)
的第一轮参与者完成了第二轮,并且两轮间没有失访偏倚的证据(S1 Consensus
Meeting Presentation)。不能参加会议的 COS-STAR 工作组成员(研究作者)需要提前联系与他们讨论结果,他们的意见会被记录并纳入会议讨论。每个可能报告条目的德尔菲结果介绍后,接着参会代表进行讨论并投票,如果超过 70% 的投票者(17 个投票者中至少 12个)打分在 7~9 分之间,则保留该条目。投票使用OMBEA 应答系统(http://www.ombea.com/)进行。在讨论共识过程第二个条目时,“介绍起初呈递给参与者的共识过程信息”,一位代表提出缺少一个伦理审批相关条目。工作组同意就此进行表决,并达成一致意见,故将此条目列入报告指南(S1ConsensusMeeting Critical Scores)。因在 COS 形成过程中纳入患者参与不断增加,所以这个问题变得更具实质意义。
管理工作组考虑报告清单格式的讨论。确认了与 COS 报告相关的必要条目,不论是为有效性试验、系统评价还是常规治疗形成的 COS 都要满足。鉴于以前报告指南形成的经验,会上代表提出了一个警示:避免第一个指南太过严格导致制定者不使用的风险增加。一些报告条目需要合并,增加一些子条目,以及建议另列一份解释性文件来提高。最终 COS-STAR 清单的有效性都得到考虑。具体来说,会后 COS-STAR 工作组做了以下修改:
(1)参与者(方法):这个主题下的四个条目存在交叉。建议被提出并被工作组采纳,用一个包括“谁、如何以及为什么”的条目更有价值。
(2)共识过程:普遍认为,虽然主题下的五个条目都可以提供有用的信息,但有些条目太具体而无需纳入,承认没有金标准的途径。工作组提出并接受了这个建议,认为一个条目包括共识过程的描述更容易被参考使用。
(3)指标打分:建议将两方面都包括到单个条目中。
(4)参与者(结果部分):建议将一些问题都合并到单个条目中。
(5)指标结果:普遍认为,因许多条目过于详细,应该合并到一起。这些问题在解释性文件中详细阐述(S1 Explanation and Elaboration)。
(6)局限性:一致认为,纳入一个与局限性有关的条目并在解释性文件中提供例子的做法较好。会后,COS-STAR 清单草案被发给 COS-STAR工作组和其他共识会议参会者。考虑了所有评论和修改意见,清单也作了相应地修订。经过多次反馈收集和清单完善的过程,直到不需要进一步改变。最终清单条目的合理性得到两位指南制定专家(Douglas G. Altman,David Moher)的审查。检测由两个正撰写 COS 研究报告的 COS 制定者执行。正在制定 COS 的两名研究人员也审阅了该声明。测试人员独立于 COS-STAR 制定过程。这次测试反馈支持 COS-STAR 清单的最终版本。
5 COS-STAR 声明
表 1 中所提供的 18 个条目的 COS-STAR 清单适用于 COS 制定研究,其目的是决定 COS 应纳入哪些结局指标,但不包括这些指标如何定义或测量等工作的报告。这份清单旨在涵盖此类研究最少的报告要求,包括背景、领域、方法、结果、结论和局限性。在配套的解释性文件中(S1 Explanationand Elaboration),为每个清单条目的含义和合理性提供了说明。这份清单设计注重实用性,对在之前的系统评价中已经确定的问题不做限制[4],如 COS形成共识的方法学(包括混合方法)和结局指标选择可能涉及的各参与群体(包括患者代表)。COSSTAR清单为 COS 研究最小的报告提供指导,但在某些情况下,研究作者可酌情增加额外的报告条目。例如,如果研究者认为重要,可能希望描述确定如何测量核心结局指标的步骤[9]。
6 讨论
COS-STAR 清单的形成运用了制定医学报告指南推荐的方法[ 6 ]。COS-STAR 清单的目的是提高COS 研究报告的透明性和完整性,以便 COS 使用者能够判断这个推荐的集合是否与他们的工作相关。例如,尽管 COS 的范围描述日益充分[1],但是仍需改进以便最大限度推广应用并不断评估。
制定 COS-STAR 配套解释文件(S1 Explanation and
Elaboration),提供每个 COS-STAR 清单条目的解释和良好报告实践框架,并配以实例为有兴趣开展 COS 研究和报告形成工作的研究者服务。格式与其他解释性文件[10, 11]中使用的格式类似。解释性文件还描述了计划好的 COS-STAR 声明的认可和推广应用策略。
COS-STAR 不是质量评估工具,也不应用于这方面,例如,比较类似 COS 相关性研究的正确性。同样,该清单也不推荐 COS 研究项目中达成共识应该使用的方法学或纳入哪些利益相关群体。这些问题的相关指导可以在其他地方找到[ 2 , 1 2 ]。例如,有几个研究已经考虑制定儿童哮喘相关的
COS,每个研究使用不同的方法且产生了具有轻微差异的核心结局指标[13-16]。尽管 COS-STAR 声明可能有助于对已发表的 COS 进行严格的评价,但其不能从不同 COS 中区分哪个应该被使用。
与经过多次修订的类似报告指南[17]一样,COSSTAR是一个不断发展的指南,未来可能需要更好地完善。共识会议代表承认:对考虑纳入或排除一些与报告条目相关的经验证据和方法学发展方面还有很多不足,这些问题今后需要更好地关注。例如,有证据表明,反馈方法确实会影响人们如何为结局指标评分[18],这或许表明这是重要的报告信息。然而,该条目被从报告清单中排除,除非有更好的关于 COS 制定者应该如何表述反馈的指南。
随着具有相关利益和经验的新利益相关方出现,该指南可能也需要修正。例如,监管机构最近建议在哮喘患者的相关医疗产品的试验中使用COS[19],这可能促进对声明提出反馈意见。德尔菲调查与共识会议的参与人员是 COS 研究形成者代表,他们的地理分布主要是在北美和欧洲[4]。这是一个公认缺陷,因为 COS 研究和本报告指南都应该考虑到低收入与中等收入国家的关联性。邀请患者代表参加,而不是患者。由于这是一个相对复杂的方法领域,选择对 COS 形成参与有一定程度了解的人员,因此需要加强他们的理解。随着 COS形成研究中患者关注和参与程度增加,他们对未来修订本报告指南的贡献将会被寻求。COMET 倡议的一个重要目标是促进更广泛的参与。虽然德尔菲邀请的接受率可能较低,但每个利益相关者群体第二轮的参与度高达 85% 以上,且没有失访偏倚证据(S1Consensus Meeting
Presentation)。邀请读者通过 COMET 网站:
(http://www.cometinitiative.org/contactus)提出评论、批评、经验和见解,这些会被考虑用于将来完善 COS-STAR 声明。