摘要:腺样体肥大(adenoid hypertrophy,AH)作为一种儿科临床常见疾病,是造成儿童上气道慢性阻塞的最常见原因,与打鼾、口呼吸、鼻塞、中耳炎与慢性鼻-鼻窦炎、阻塞性睡眠呼吸暂停(obstructive sleep apnea,OSA)等病症密切相关。
腺样体肥大(adenoid hypertrophy,AH)作为一种儿科临床常见疾病,是造成儿童上气道慢性阻塞的最常见原因,与打鼾、口呼吸、鼻塞、中耳炎与慢性鼻-鼻窦炎、阻塞性睡眠呼吸暂停(obstructive sleep apnea,OSA)等病症密切相关。口呼吸起始年龄与持续时间、OSA严重程度等影响AH的治疗,早发现、早干预尤为重要。当鼻咽镜评估腺样体分级为I级、II级和III级时,治疗AH常首先建议药物保守治疗,当药物治疗无效,尤其是III级及以上合并复发性急性中耳炎或分泌性中耳炎、重度OSA、心肺并发症等手术适应证时,则建议进行手术治疗。然而,目前国内外西医指南尚无治疗AH的明确药物推荐[1-3]。
AH是中医药治疗儿科临床优势病种。中医临床实践发现,中药在缩小肥大腺样体、改善症状和生活质量等方面具有优势,且安全性较好。《儿童腺样体肥大中医诊疗指南》将银翘散、桃红四物汤、导痰汤等中药作为临床推荐用药,中医外治法(针刺、推拿、耳针、穴位贴敷疗法)也有推荐,但证据有限[4-5]。中药临床治疗多为一人一方中药汤剂,不如中成药易于接受和推广。然而,AH目前尚无可用中成药,不能满足不断增长的临床治疗需求,为儿童中成药研发建议病种[6]。近年来,为评价中医药治疗儿童AH的有效性,临床上开展了大量的随机对照试验(randomized controlled trials,RCTs)。RCT是有效性研究的金标准,其质量决定研究结果的真实性和可靠性[7]。因此,本研究旨在评价中医药治疗儿童AH的RCTs质量,分析临床试验设计中研究对象、临床定位、结局指标等关键要素,发现问题并提出解决策略,为今后开展中医药治疗儿童AH的RCT提供借鉴与参考。
1 资料与方法
1.1 检索策略
计算机检索中国知网(CNKI)、万方(Wanfang)、维普(VIP)、中国生物医学文献服务系统(SinoMed)、PubMed、Cochrane Library、Embase、Web of Science(WOS)数据库,以及ClinicalTrials.gov、中国临床试验注册中心(Chinese Clinical Trial Registry,ChiCTR)、国际传统医学临床试验注册平台(International Traditional Medicine Clinical Trial Registry,ITMCTR)。中文检索词包括“腺样体肥大”“儿童”“随机”等;英文检索词包括“adenoid* hypertrophy”“child*”“random*”等。为避免漏检,不限定中医药干预措施检索词,通过纳排标准筛选。检索时限为各数据库建库至2024年5月15日。
1.2 纳入标准
(1)研究对象为明确诊断为AH的儿童(<18岁)[8-9];(2)干预措施为中医药疗法(中药、针灸、推拿等);(3)对照措施不限;(4)结局指标不限;(5)研究类型为RCT。
1.3 排除标准
(1)文摘、数据缺失或无法获取全文的文献;(2)重复发表的文献选择信息最全者。
1.4 文献筛选
应用NoteExpress 3.8.0.9520软件对不同数据库检索到的题录进行汇总、查重,删除重复题录;根据纳入和排除标准,阅读标题和摘要,排除明显不符合的题录;阅读全文进行复筛。文献筛选过程由2名研究人员独立进行,如有分歧则通过讨论或与第3位研究人员协商解决。
1.5 数据提取与规范化
使用Excel 2021软件对纳入文献进行数据提取,包括一般资料(标题、作者、年份)、临床定位、试验设计(随机、对照、盲法、样本量等)、研究对象(西医诊断标准、中医证型与辨证标准)、干预措施、试验流程、结局指标与观测时点等。参照《中医临床诊疗术语第2部分:证候》[10]对中医证型进行规范化处理,如将“痰瘀阻络证”“痰凝血瘀证”规范统一为“痰瘀互结证”。参照《中医药临床试验核心指标集研制技术规范》[11]对结局指标进行规范化处理,并归为中医病证、症状/体征、理化检测、生活质量、远期预后、经济学评估、安全性事件、其他指标8个指标域。由2名研究人员独立进行,如有分歧则通过讨论或与第3位研究人员协商解决。
1.6 方法学质量评价
采用Cochrane随机对照试验偏倚风险评价工具2.0(Cochrane bias assessment tool for randomized controlled trials,RoB 2.0)[12]对纳入文献进行方法学质量评价。由2名评价者对每篇文献使用相同的“Unique ID”独立进行评价,并应用RoB 2.0工具的“Discrepancy Check”按钮功能检查评价结果的一致性,有差异的信号问题通过讨论达成一致或与第3位研究人员协商判断。
1.7 报告质量评价
应用临床试验报告统一标准(consolidated standards of reporting trials,CONSORT)声明-结局指标2022扩展版[13-14]对纳入文献进行报告质量评价。由2名研究人员独立进行,如有分歧则通过讨论或与第3位研究人员协商解决。
1.8 统计分析
应用Excel 2021软件建立中医药治疗儿童AH的RCTs数据库。对纳入研究的基本特征、质量评价结果与结局指标等按频次、频率进行描述性统计分析。
2 结果
2.1 文献检索与筛选结果
共检索到3 253项RCTs,经查重和阅读标题、摘要及全文后,最终纳入182项RCTs,包括178篇文献和4项注册信息。文献筛选流程见图1。
2.2 纳入研究的基本特征
纳入研究最早发表于2005年,整体年发文量呈增长趋势,尤以近5年增长最快,见图2。182项RCTs涉及AH患儿14 798例,单项研究样本量最多480例,最少42例,多集中在60~100例(84.07%)。178篇文献参考AH的西医诊断标准有42种191次;其中,121篇(67.98%)采用病证结合模式研究,涉及中医证型30种,频次前5的证型依次为痰瘀互结证(34篇)、肺脾气虚证(22篇)、气血瘀阻证(11篇)、脾虚痰阻证(8篇)、痰热互结证(5篇);参考的中医辨证标准有26种139次。干预措施主要是中药(86.29%),其次有中医外治法和联合疗法,中药包括自拟中药方(83.44%)、经典名方(12.74%)及中成药(3.82%);中药给药途径主要为口服(97.45%),其次有雾化吸入、滴鼻及鼻咽熏蒸。对照措施主要是化学药(74.73%),其次有中药、中医外治法、中药联合化学药、物理疗法、手术及安慰剂。纳入文献均报告了疗程与访视,疗程1~16周,频率前3的依次为4周(53.37%)、8周(13.48%)、12周(11.80%);访视时点2~5个,大多数研究仅设计治疗前后2个(85.16%);45篇文献报告了治疗结束后随访,随访期4~48周,频率前3的依次为4周(48.89%)、12周(28.89%)、24周(11.11%)。4周的治疗期、访视间隔与随访期选用率最高。
2.3 方法学质量评价结果
纳入的178项RCTs的整体偏倚风险结果为166篇“有一定风险”(93.3%)、12篇“高风险”(6.74%)、0篇“低风险”。(1)随机化过程中的偏倚,170篇仅提及“随机”或“随机数字表、计算机或统计软件产生随机序列”,未报告随机化实施过程及分配隐藏均被评为“有一定风险”(95.51%);7篇报告了随机化和分配隐藏实施情况,被评为“低风险”(3.93%);1篇采用“就诊奇偶顺序随机”的错误随机方法,被评为“高风险”(0.56%)。(2)偏离既定干预措施的偏倚,144篇被评为“低风险”(80.90%),24篇被评为“有一定风险”(13.48%),10篇被评为“高风险”(5.62%),风险来自未对研究对象和干预措施提供方实施盲法,及试验中出现偏离既定干预措施的情况却未采用恰当的统计分析方法控制偏倚。(3)结局数据缺失的偏倚,167篇被评为“低风险”(93.82%),3篇被评为“有一定风险”(1.69%),8篇被评为“高风险”(4.49%),风险来自结局数据缺失比例较大,组间缺失原因及比例不同,且未采用分析方法校正偏倚,亦未进行敏感性分析。(4)结局测量的偏倚,167篇被评为“有一定风险”(93.8%),10篇被评为“低风险”(5.62%),1篇被评为“高风险”(0.56%),风险主要来自未对结局测量者实施盲法,知晓干预措施有可能影响主观指标的测量。(5)选择性报告结果的偏倚,178篇均未在研究开始之前注册,亦未发表试验方案或统计分析计划书,缺乏信息评估结果的数据分析与预设统计分析计划的一致性,均被评为“有一定风险”。纳入研究的偏倚风险见图3。
2.4 报告质量评价结果
纳入的178项RCTs的报告质量结果显示,“文题”“背景和目的”“试验设计”“结局指标”“样本量”“分配隐藏”“随机实施”等41个条目报告率<50%(75.93%),其中18个条目报告率为0,包括“辅助分析”“试验注册”“试验方案”等。具体见表1。
2.5 结局指标
纳入研究共报告结局指标90种,出现频次996次,根据指标的功能属性分为8个指标域,包括中医病证9种(264次,26.51%)、理化检测50种(256次,25.70%)、症状/体征13种(244次,24.50%)、安全性事件8种(101次,10.14%)、生活质量6种(97次,9.74%)、远期预后2种(32次,3.21%)、其他指标2种(2次,0.20%)、经济学评估0种。结局指标分类与使用频次见表2。
3 讨论
3.1 基于ROB 2.0的方法学质量问题
纳入文献整体方法学质量较差,主要源自随机化过程、结局测量与选择性报告结果领域。临床研究正确实施随机分组是降低选择性偏倚及提高组间均衡性的重要措施。同时,实施盲法可在一定程度上避免研究参与者主观因素对试验的影响,特别是在以主观指标为主时避免测量偏倚的发生。在研究开始之前注册、发表试验方案和统计分析计划书,可在一定程度上防止选择性报告研究结果。虽然,“偏离既定干预措施的偏倚”与“结局数据缺失的偏倚”2个领域评价结果显示风险较低,但由于大多数研究均未报告是否有偏离既定干预措施的情况,也未报告获取结局数据的情况,评估者仅能进行推测,导致评估结果具有较强的主观性。
3.2 基于CONSORT-结局指标2022扩展版的报告质量问题
纳入文献整体报告质量较差,呈现出报告不规范、不完整等现象。具体包括:①文题报告不准确,仅1篇文题能识别是RCT,其余文题大多为“临床观察”“疗效观察”等,不能通过文题明确识别临床研究的类型。②背景与理由说明不充分、试验目的不明确,约80%的研究未说明试验理由,93%的研究未明确报告试验目的,仅概括性表述为评价有效性。③试验设计报告不明确,约93%的研究缺乏关于试验总体设计的报告,如随机化实施、样本量估算、检验类型等,影响试验的质量。④结局指标报告不规范,约95%的研究未报告主要结局指标及指标测量工具的可靠性、评估人员和质量控制措施,所有研究均未报告选择试验主要结局指标的理由。⑤统计分析方法不恰当,纳入文献存在目前国内临床试验报告中存在的共性问题,缺乏剔除数据的描述,或虽报告了剔除人数但未说明剔除标准和不遵循试验方案的分析方法,一律采用符合方案分析,不符合意向性分析原则;且大多未报告结局指标组间差异的效应值及其可信区间难以判断研究结果的临床意义[15]。
3.3 研究对象与临床定位分析
3.3.1 研究对象一致性差 AH目前尚缺乏国内外公认、统一的诊断标准,临床研究参照的诊断标准及腺样体分级标准多样。病证结合模式可以弥补单纯辨病或辨证的局限,有助于限定研究对象范围。然而,统计结果显示,本病临床研究选择的证候多达30种,不同研究间辨证参考依据不统一且自拟标准多样;参考的教材、指南及专家共识涉及的证候有限,不能涵盖所有证候类型,且判定形式为叙述法,通过列举症状对证候进行判定的这种定性化辨证方法欠客观且不够量化与精确,难以实现不同研究间的辨证统一,是导致研究对象一致性较差的原因。
3.3.2 临床定位不明确 临床定位是临床研究和临床应用的核心,临床定位准确有利于临床研究设计和临床价值体现,是药物研发成功和合理用药的关键[16]。纳入研究大多概括性定位于评价中药治疗儿童AH的有效性,未对疾病严重程度、伴随疾病等进行限定,也未根据研究药物在前期人用经验发现的临床价值明确试验目的及区分主次。AH的发生发展与临床表现具有复杂性,一种干预措施难以在各个阶段都有治疗优势,过于模糊和宽泛的临床定位影响受试者的选择、评价指标的确定及试验流程的设置等临床研究设计的关键环节,难以真正体现中医药的临床优势。
3.4 结局指标分析
3.4.1 指标选择异质性大 临床研究结局指标的选择需满足合理性、科学性与可行性等。中药的疗效评价应当以患者为中心结合临床治疗特点,确定与中药临床定位相适应、体现其作用特点和临床优势的疗效指标[17]。纳入研究报告的结局指标存在种类繁多、选择差异较大、客观指标种类多应用少等问题。报告的90种结局指标中,出现频次≥10次的指标有18种(754次,75.70%),而报告频次≤3次的指标多达41种(66次,6.63%),多为理化检测指标。单项研究指标数量选择最少为1个,最多有17个。疗效指标中客观指标多达58种,应用率仅占28.41%。
3.4.2主要与次要指标区分少 临床试验应明确界定主要和次要结局指标,并说明选择主要结局指标的理由[17]。主要指标是反映临床试验主要目的的指标,应与拟定的临床定位相一致,数量不宜太多,通常只有1个,应具有较好的信效度、易于观测且为研究领域公认,并应在临床试验方案中预先明确设定[18]。纳入研究中,仅12项区分了主要和次要结局指标,均未说明主要指标的选择理由;主要指标数量在1~4个,因临床定位不明确,难以判断主要指标与临床定位的一致性。
3.4.3 指标观测与评价方法不统一 临床研究不仅要合理选择指标,还需要准确测量与评价。指标测量工具需满足公认、准确及可重复测量的要求。症状评分作为本研究领域最常用的疗效观测指标,目前缺乏具有AH病种特点的国际公认、标准的评分工具,现有量表多为研究者自制,存在制定过程欠规范、症状严重程度分级和赋分标准不统一及量表信效度检验欠缺等问题。鼻咽侧位X线片和鼻咽镜作为临床常用的观测腺样体大小的客观工具,测量与评价方法均较多,纳入研究选择的标准多不统一。随着摄片技术与评价体系的不断完善,近年来,越来越多的研究者与临床医生推荐鼻咽侧位X线片腺样体厚度与鼻咽腔宽度(adenoid/ nasopharyngeal,A/N)比值法作为判断腺样体大小的客观标准[19]。观测时点设定不恰当亦是造成指标评估不准确的原因,约75%的研究治疗观察期设置6~16周,在同时观测主观指标与客观指标的情况下,仅设计治疗前后2个观测时点,难以准确观察主观症状的变化情况。
3.4.4 中医指标不规范 纳入研究应用最多的指标域为中医病证类,包括中医症状积分与中医证候疗效。其中,中医症状积分最常用,由于缺乏统一参考标准,不同研究间中医主次症的选择及赋分标准多不一致。以中医症状积分定义的中医证候疗效作为复合指标应用率亦较高,评价方式多为四级分法(痊愈、显效、有效、无效),划分截断点较为随意,多缺乏依据。建议参照《中药新药临床研究一般原则》,对于缺乏信效度评价的中医证候量表,中医证候疗效可以采用减分率(或消失率/复常率)按二分类资料进行统计比较分析,如当以治疗前后的减分值为主要疗效指标时,可以治疗后减分率≥50%定义为“有效”计算有效率作为次要疗效指标[18]。
3.4.5 远期预后指标关注不足及缺乏经济学指标 纳入研究仅29篇(16.29%)报告远期预后指标,包括复发率(26次,2.61%)和并发症发生率(6次,0.60%)2种。腺样体引起的气道阻塞可导致一系列病症,且无论是手术切除还是药物治疗后均有可能复发,关注远期预后指标可以真实反映药物的远期疗效[1,20-21]。此外,经济学指标亦是体现中医药价值的重要指标,而纳入研究缺乏经济学指标的报告。
3.4.6 安全性事件报告不规范 纳入研究仅73篇(41.01%)报告了安全性事件,包括不良反应发生率(68次,6.83%)、实验室理化检查(25次,2.51%)和不良事件发生率(8次,0.80%)。中药不良反应主要发生在胃肠系统,其他还有皮肤系统和过敏反应;当化学药作为基础治疗或对照措施时,除以上不良反应外,主要出现鼻腔局部不良反应,同时还有肝胆系统及全身的不良反应。根据临床试验相关伦理要求,受试者的权益和安全是考虑的首要因素[22]。然而,纳入研究关于安全性事件报告较少,且大多报告不规范,缺乏对于不良事件严重程度及与试验药物的因果关系判断标准等的报告。今后的研究应关注以上安全性事件的观察,并规范报告安全性事件的发生情况,无论是否发生安全性事件均应进行报告。
4 结论与应对策略
本研究总结分析了中医药治疗儿童AH的RCTs质量现状,纳入研究结局指标的选择对今后的研究具有一定的借鉴意义。对于纳入研究整体质量不高和研究对象一致性较差、临床定位不明确、结局指标不统一等问题,提出以下应对策略:(1)将研究分为设计、实施、统计和报告4个阶段,制定每阶段详细的操作手册,包括临床研究方案、标准化操作程序、统计分析计划书和报告规范;(2)参照国际公认的临床试验质量管理标准,如《ICH E6(R2)临床试验质量管理规范》[23]、《药物临床试验质量管理规范》[22],规范临床试验设计、实施、监督、记录和报告方法,如在研究设计阶段引入方法学和统计学人员参与,研究开始之前对参与研究人员进行方案及附属文件的培训,规定质量控制人员定期评估纳入研究对象和数据收集的规范性,研究结束后进行数据审核,以提高临床试验质量;(3)参照国际公认的RCT报告标准CONSORT声明,特别是其扩展版(如CONSORT-结局指标2022扩展版)对结局指标的报告提出了明确要求,规范报告研究结果以提高研究透明度和完整性[13,24];(4)研制AH统一的西医诊断标准和量化的中医辨证标准,以准确限定研究人群范围,提高研究对象的一致性;(5)坚持以临床价值为导向,根据疾病特点、中医药理论、人用经验等综合判断,以明确临床定位[17];建议同时以改善临床症状和缩小腺样体作为中药治疗儿童AH的临床定位,同时以主要临床症状(打鼾、口呼吸、鼻塞)总分和鼻咽侧位X线片A/N值为主要评价指标[25];(6)构建儿童AH的中医药临床试验核心指标集,以解决中医药临床研究疗效评价指标不一致、不规范和不公认的问题[11]。期望未来开展设计严谨、实施高质、报告规范的临床试验,促进研究向实践转化。
来 源:柳 平,蔡秋晗,陈月月,程珊珊,许雅倩,胡思源.中医药治疗儿童腺样体肥大随机对照试验的质量现状及应对策略 [J]. 中草药, 2025, 56(9): 3234-3244.
来源:天津中草药一点号