“核心指标集”这一概念在国外提出已有近40 年历史,自2010年有效性试验核心结局指标测量(Core Outcome Measures in Effectiveness Trials,COMET)工作组成立以来,通过不断总结核心指标集研究的经验与方法,发布了一系列研究与报告规范相关的指南来确保核心指标集研究的质量。目前,核心指标集报告规范(Core Outcome Set-STAndards for Reporting,COS-STAR)[1]和核心指标集研究标准(Core Outcome Set-STAndards for
Development,COS-STAD)[2]已先后发布,并应用于相关研究中,是提高核心指标集报告规范和研究水平的重要基石。虽然在 COS-STAD 推荐意见中,并未对是否公开核心指标集研究方案达成共识,但在核心指标集研究开始前,提供核心指标集研究的研究方案有助于研究的完整性和核心指标集形成的透明度。因此,COMET 工作组达成共识,在 2019年 2 月发布了核心指标集研究方案的标准报告条目(Core Outcome
Set-STAndardised Protocol Items,COS-STAP),即 COS-STAP 声明[3]。
目前国内已有研究解读了 COS-STAR 声明及COS-STAD 推荐意见[4, 5],因此不再赘述。本文旨在对 COS-STAP 声明进行介绍与解读,并与 COSSTAR声明、COS-STAD 推荐意见进行比较,最后探讨这些报告指南在中医药领域核心指标集研究中的意义。
1 COS-STAP 声明解读
在核心指标集中,除明确应当测量哪些指标外,用什么工具测量也同样重要[6]。为此,COMET工作组发布了如何为核心指标集的结局指标选择测量工具的指南[7, 8]。但 COS-STAP 声明主要应用于“确定应当测量哪些指标”的研究方案,并未包含测量工具相关内容。COS-STAP 声明制定流程:① 初始清单的来源有两部分:研究者的个人经验和 COS-STAR 声明,共 35 个条目。② 研究小组邀请了 3 个利益相关群体(核心指标集研究者、期刊编辑、核心指标集患者与公众参与相关研究的研究者)参加德尔菲调查。调查问卷采用 9 分 Likert 评分法,其中 1~3分代表“不重要”,4~6 分代表“重要”,7~9 分代表“非常重要”。德尔菲调查的参与者在第一轮调查中提出了65个新条目,删除重复条目后,共10个条目进入第二轮德尔菲调查。③ 第二轮德尔菲调查完成后,45 个条目全部提交共识会议参与者,经共识会议参与者同意后,其中 13 个条目自动纳入 COS-STAP 清单;有7个条目虽被评为 7~9分,但每个利益相关群体中少于 50% 的参与者同意此评分,因此被排除不再进行讨论;其余 25 个条目的结果由共识会议参与者进行讨论和投票,如果超过 70% 的参与者打 7~9 分,则保留该条目。共识会议共8名参与者参与投票。其中3名英国参与者参加现场会议,其他参与者(2 名来自英国,1 名来自欧洲其它国家,2 名来自美国)参加网络会议。在共识会议上进行讨论并重新打分后,COSSTAP清单最终纳入 13 个条目(见表 1)。
COS-STAP 清单条目分为 13 个条目共包含 6个主题,分别是题目/摘要、引言、方法、分析、伦理与传播、管理信息等。除题目/摘要及引言、伦理等基本信息外,方法、分析、管理信息等内容与研究过程密切相关,任何违背研究方案的内容均可能导致偏倚或导致核心指标集的结果发生变化。
与核心指标集的结果密切相关的因素在COMET 工作组前期发表的《COMET 手册》1.0 版中有详细描述[ 6 , 9 ]。其中比较重要的有以下几方面:① 利益相关者:利益相关者的选择应具有代表性和广泛性,以便核心指标集的结果能被广泛接受。②
信息来源:获得结局指标清单的信息来源应尽量全面,如文献综述与患者半结构化访谈相结合。③ 结局指标规范化:详细描述如何删除/合并结局指标,避免丢失重要的结局指标。④
共识方法:目前采用的共识方法包括德尔菲调查[10]、共识会议[11]、半结构化小组[12]和名义群体法[13]等。有调查显示,85% 的研究单独使用德尔菲调查或德尔菲调查与其他方法相结合;正在进行的研究中,采用定性访谈、德尔菲调查和共识会议相结合的研究占25%[14]。⑤ 明确共识定义:不同研究采用的共识定义标准不同,共识标准太宽泛可能会导致纳入核心指标集的指标过多;共识标准太严格可能会导致一些比较重要的结局指标不能纳入核心指标集。如不少研究采用的共识定义为:≥70% 参与者打分 7~9 分,且<15% 的参与者打分 1~3 分,则定义为“对纳入达成共识”;≥70% 参与者打分 1~3分,且<15% 的参与者打分 7~9 分,则定义为“对排除达成共识”;除以上两种情况外的则定义为“未达成共识”[ 1 5 , 1 6 ]。但实际在大部分共识会议中,研究者很少打 1~3 分,导致“对排除达成共识”这一定义在很多情况下是无效的,因此,有研究在共识会议中更改了这一标准,将≤50% 的参与者打分 7~9 分视为“对排除达成共识”。目前并无证据表明哪种共识定义更好,但研究者应首先在研究方案中予以明确规定。⑥
结局指标评分:不同研究采用的结局指标评分方法不同,如采用Likert 评分法[15]、结果排名[17]和分数分布法[18]等。其中 Likert 评分法最常用,包括 4 分法、5 分法、7 分法、9 分法等[9]。不同评分方法对结果的影响尚不清楚,但研究者应在方案中予以明确,并避免在研究过程中随意更改,以减少偏倚发生。⑦
结果反馈方法:在多轮次的德尔菲调查中,如何反馈上一轮的调查结果,应在研究方案中予以明确。有研究显示,不同的反馈方法可能会影响核心指标集的结果[19],因此研究者在方案中应根据研究特点,谨慎选择合适的方法。⑧ 缺失数据:数据缺失可能会造成失访。大部分研究中,失访和不完全回复是造成数据缺失的主要原因,因此,研究者应在研究方案中明确如何处理缺失数据,尤其是对首轮调查不完全回复者,是否邀请这些参与者继续参加后面的研究均应予以说明。⑨
其它可能影响结果的因素:如资助者是否会对研究过程施加影响,是否存在已知的利益冲突(包括经济利益冲突、学术利益冲突)等,都应在研究方案中明确说明。
2 COS-STAP 与 COS-STAR、COS-STAD 比较
COS-STAP 声明内容与 COS-STAR 声明、COSSTAD推荐意见有相互重叠的部分,但各自的侧重点不同:COS-STAP 声明集中于对核心指标集研究方案的报告,COS-STAR 声明集中于对核心指标集研究结果的报告。但对于一个核心指标集研究而言,即使完整报告了 COS-STAP 声明和 COS-STAR声明的内容,也仅是保证了核心指标集研究的报告质量,而不能保证核心指标集研究的方法学质量,因此还需要采用 COS-STAD 推荐意见用以补充COS-STAP 声明和 COS-STAR 声明中与研究方法相关的条目的不足。三者相辅相成,能使用户更容易判断核心指标集研究的价值,以决定是否能在相关研究中应用。COS- STAP 与 COS-STAR、COSSTAD的比较见表 2。
COS-STAP 声明中有 11 个条目与 COS-STAR声明重叠,条目的一致性可以确保研究从研究方案平稳过渡到研究结果,同时有助于判断研究过程中是否存在偏倚。COS-STAD 推荐意见的 11 个条目属于 COS-STAP 声明和 COS-STAR 声明中的范围、利益相关者和共识过程三个范畴。在 COS-STAP声明和 COS-STAR 声明中,仅提出应详细描述这几项内容,而 COS-STAD 推荐意见则对这几项内容应达到哪些标准予以更详细的规定,如研究范围应包含的细节、参与者应纳入的利益相关群体、共识过程应考虑的内容等,确保研究者在研究过程中可以参照 COS-STAD 推荐意见设立更详细的方法学标准。
3 核心指标集研究及报告指南对中医药领域研究的意义
COS-STAR 声明制定中,共识会议的参与者均来自欧洲和美国;而德尔菲调查的参与者大部分来自欧洲和北美,少数来自于亚洲、大洋洲和南美洲,其中包括 1 名中国大陆和 1 名中国香港的学者[1]。COS-STAD 推荐意见的研究小组成员均来自欧洲和美国;德尔菲调查参与者的来源不详[2]。COSSTAP声明的制定中,共识会议的参与者均来自洲和美国;德尔菲调查的参与者大部分来自欧洲和北美,极少数来自大洋洲和亚洲[3]。笔者参与了COS-STAP 的德尔菲调查,但是否有其他来自中国的中医研究者参与相关指南的共识过程尚无法从公开资料中得知。从这些指南的参与者构成来看,其共识结果很难代表中国研究者的观点。核心指标集研究与报告指南是否适用于中医药领域核心指标集的构建,尚需进一步研究。我们认为从目前来看,核心指标集研究及报告指南对中医药领域仍具有重要意义。
3.1 有助于中医药领域核心指标集研究的完整和透明
核心指标集研究在国内起步较晚[20, 21, 22],国内研究者陆续开展相关研究,但大部分都集中于方法学探讨。截止到 2019 年 5 月,国内研究者注册的核心指标集研究仅有 13 项,主要集中在中医药领域[23]。直到 2018 年,第一篇中医药领域核心指标集研究方案才公开发表[24]。目前国内仅发表的 2 篇核心指标集研究方案均属于中医药领域。由于这两篇研究方案均在 COS-STAP 声明发布前发表,因此均并未完整报告 COS-STAP 声明的相关条目:如一项研究未描述在共识中如何处理缺失数据,未提及核心指标集完成后的传播计划[24];另一项研究未详细描述核心指标集涵盖的目标人群,未提及如何删除/合并结局指标,未描述在共识中如何处理缺失数据[25]。目前仅完成第一项研究并在学位论文中报告了研究结果[15],除未声明利益冲突外,该研究详细报告了 COS-STAR 声明的其它条目。在中医药领域核心指标集研究的起步阶段,推荐应用 COS-STAP 声明和 COS-STAR 声明进行研究方案和研究结果的报告,以确保研究设计及实施的完整和透明,减少研究偏倚的发生。
3.2 有助于中医药领域核心指标集研究的规范化
目前,中医药领域临床研究的方法学质量和报告质量普遍较低[26],导致很多研究无法为临床实践提供高质量证据。这种情况与相关临床研究及报告指南引入国内较晚,且未引起研究者的足够重视有关。将核心指标集研究及报告指南引入国内,应用于中医药领域核心指标集研究,能帮助研究者规范化报告核心指标集研究的研究方案和研究结果,确保核心指标集的研究质量,减少低水平、重复研究的数量。
3.3 有助于中医药领域临床研究者选择合适的核心指标集
核心指标集从设计到完成一般需要几年时间,加上当前中医药领域核心指标集研究较少,以至于目前中医研究者在开展临床研究时,往往无合适的核心指标集可选择。但是研究者可根据核心指标集研究及报告指南,判断已完成的核心指标集的报告和研究质量及是否存在偏倚等情况,并可综合考虑核心指标集涵盖的健康问题、人群、干预措施等细节,判断已有的核心指标集是否适合即将开展的中医临床研究。
3.4 有助于减少中医药领域核心指标集研究的浪费
COMET 工作组成立的初衷是促进国际合作,提倡在一个疾病领域制作一个核心指标集,以减少研究浪费。在未来的研究中,应关注同一疾病不同类型、不同干预措施、不同人群的共性,仅制作一个相关的核心指标集,并在其基础上补充特异性的指标,而非同一疾病从不同角度出发制作多个核心指标集[ 2 7 ]。COS-STAP 声明、COS-STAR 声明和COS-STAD 推荐意见的应用,能有效帮助研究者判断现有的核心指标集是否适用于中医药临床研究中具有普遍性的指标,如能在此基础上补充中医药特异性指标,或针对现有核心指标集的中医药适用性咨询中医药领域相关专家并达成共识,并不用针对中医药特定的干预措施开展新的研究,则能在一定程度上减少不必要的研究资源浪费。
3.5 为中医药领域核心指标集研究方法学的完善提供借鉴
目前普遍认为,中医药领域的核心指标集应突出中医特色,如中医证候指标[21, 28, 29]。在目前发表的两项中医药领域核心指标集研究方案中,均提及了中医证候相关信息,但仅有一项研究详细描述了中医证候指标的研究方法。现在可通过系统评价、病例回顾获得特定疾病的证候名称,形成中医证候名称数据库;通过横断面调查获得特定疾病中医证候的分布,从中医证候名称数据库中选择与每类证候的证候要素相同或相似的证候名称,由专家选出合适的证候名称进行命名;对每类证候的四诊信息进行共识,确定每类证候的核心症状/体征[15, 24]。但这些中医药证候指标选择方法的优劣尚需进一步验证。如果研究者能够根据 COS-STAP 声明和COS-STAD 推荐意见进行研究设计,并根据中医药特点进行调整和优化,能够有效帮助中医研究者完善中医药领域核心指标集研究的方法学。
4 展望
“工善其事,必利其器”,在中医药领域核心指标集研究的起步阶段引入 COS-STAP 声明、COSSTAR声明和 COS-STAD 推荐意见,不仅能帮助相关研究者在研究之初制定完善的研究方案,也有助于提高研究的完整性、透明度和研究质量。同时,借鉴国外相对完善的核心指标集研究及报告方法,能有效减少中医药领域核心指标集研究资源的浪费。