临床预测模型这么火,它到底是什么?!
发布日期:2022-03-10 作者:WLT 点击:
临床预测模型既重要又复杂。
近年来,临床预测模型在诊疗决策、患者预后管理和公共卫生资源配置中的应用越来越重要,但临床预测模型的建立是一项复杂的系统工程。本文回顾了相关的权威研究,总结了建立临床预测模型的全过程,介绍了相关概念和重要原则。
建立临床预测模型的五个阶段
在个性化的医学时代,对流行病或意外疾病的结果(诊断)或未来疾病进展(预后)的预测对于医护人员的患者管理变得更加重要。临床预测模型用于研究特定条件下患者未来或未知结局(终点)与基线健康状态(起点)之间的关系。它通常结合多个参数来帮助医生洞察模型中每个预测因子的相对影响。
该模型需要准确预测特定事件,并且相对简单易用。一方面,如果预测模型对未来事件的估计不准确,会误导医疗专业人士;另一方面,如果模型具有较高的可预测性,但难以应用(例如,计算复杂或不熟悉的问题/项目或单元),耗时、成本高或相关性低(例如,对所有患者进行无差别筛查),则不会在临床上广泛应用。因此,可预测性和可操作性之间的平衡是建立良好临床预测模型的关键。
目前,虽然对预测模型的理想构建方法还没有达成共识,但临床研究领域的许多专家提出了许多方法来提高模型开发的质量和影响力。基于前人的研究成果,本文将建立临床预测模型的全过程归纳为五个主要阶段:
建立临床预测模型的五个阶段
一个
第一阶段:界定研究问题。
从统计技术的角度来看,临床预测模型是临床研究中比较先进的研究类型,但并不是所有的问题都适合用临床预测模型来回答。例如,干预/暴露措施的效果估计和比较适合用传统的统计假设检验或校正模型来回答,如T检验/方差分析、卡方检验和对数秩检验。临床预测模型适用于回答与疾病的诊断或预后相关的问题,特别是如何通过预测因素的组合来准确估计疾病或事件发生的概率。临床预测模型的本质是利用临床数据集建立一个多元的、高精度的、有意义的预测模型。首先,我们需要明确几个重要的研究问题:1)靶疾病领域的靶结果是什么?如糖尿病和心血管疾病;某种并发症,死亡。2)目标患者是谁?例如普通人群、65岁以上的老年人或二型糖尿病患者。3)预测模型的目标用户是谁?例如疾病领域的其他医生、健康相关组织、处于疾病风险中的群体和关注疾病的其他群体。根据以上问题的回答,结合患者选择的目标区域和相关区域的数据集,目标用户的类别将决定指标的选择和处理过程,从而影响临床预测模型的专业性和复杂性。
预测模型适用的问题类型。
2
第二阶段:选择数据集。
在融合的过程中,医学教学、科研、管理的应用需要人才的聚集和产业生态的建立。自2013年成立以来,国内已有近百家领先的医疗研究机构(150强)和政府机构与医疗人工智能公司医疗都匀展开合作。医学都匀在发展中,凭借其战略国际化和文化多样性,吸引了专业领域的世界知名科学家和人才。整合了跨越10余年的医学信息进行医院处理和整合,覆盖40余种重大疾病,创建了3000余个专科疾病模型,自主研发了医学数据智能平台。数据集是临床预测模型最重要的组成部分之一。在现实中,需要搜索最合适的数据集并充分利用它。通常,您也可以选择使用专业的临床数据源辅助和管理工具来整理和建立包含研究终点和所有关键预测指标的主数据集。研究人员可以根据预测模型的目的,使用不同的方法提取不同的子数据集。不同的临床预测模型问题适合用不同的研究设计数据来回答。对于诊断问题来说,预测因素和结果都在同一时间或短时间内,因此使用横截面数据建立诊断模型是合适的。对于预后问题,预测因子和结果之间存在纵向时间逻辑,适合用队列研究数据拟合预后模型。随机临床试验可视为更严谨的前瞻性队列,因此也可用于建立预后模型,但外推法有限。不同类型的临床预测模型的特征如下表所示:
不同预测模型的特点及数据选择
对于数据集中样本容量的最低要求,没有绝对的共识。一般来说,较大且较新的数据集能更好地反映目标群体的特征,增强模型的相关性、可重复性和普及性,是建模的理想选择。为了客观地验证建模结果,通常需要将研究数据分为训练数据集和验证数据集两部分。根据研究者的具体目标,分割率可能有所不同,但一般来说,更多的研究对象应该被分配到开发数据集,而不是验证数据集。临床预测模型首先通过算法从训练集中提取规则,其预测性能要根据验证集在不同的组中进行评估。为了确定模型的可扩展性和健壮性,可以根据数据集格式,尽可能使用来自外部研究组或队列的测试数据集进行外部验证。
医疗大数据成为预测模型数据集的重要选择。
三
第三阶段:处理特征变量。
首先,需要对确定的数据集进行基本的清洗,包括检查数据一致性、处理无效值和错误值等。因为数据集通常包含比最终预测模型中使用的变量更多的变量,所以在建立模型之前,需要评估和选择最可预测和最敏感的预测因子。一般来说,特征变量的评价主要有三个方面:1。要求检查员处理丢失的数据。在大多数数据分析中,数据缺失是一个长期的问题,丢失的原因各不相同,包括不收集、不可用或不适用、被调查者拒绝,或者“不知道”。为了解决这个问题,研究人员可以考虑使用插值技术将答案分为“是”和“其他”,或者允许“未知”作为单独的类别,以尽可能提高数据填充率。
2.需要专家对之前发现的显著预测因子进行判断,通常应将其作为候选变量,如糖尿病风险评分中的糖尿病家族史。应该注意的是,并非所有重要的预测因素都需要包括在最终模型中,例如P
3.要求数据科学家对变量编码分类变量和连续变量有不同的处理方法。对于分类变量,我们可以根据临床实际意义和数据特点,对类别进行组合或重新分类。比如,在基本的人口特征中,教育程度往往分为小学、初中、高中、大专、本科、研究生、博士等。根据分析和以往研究的需要,高中毕业与否可能是一个重要的分界点,可以重新划分为小学、中学、本科及以上。这样可以相对平衡其他人的数量,避免过度细分。连续变量的相对影响由模型中使用的测量尺度决定。例如,空腹血糖水平对心血管疾病风险的影响可以解释为,每10 mg/dl通常比每1 mg/dl对结果的影响更大。在对特征变量进行求值和处理后,由于不同的算法需要不同的数据类型,所以需要对数据和算法进行适配。通常情况下,连续变量通常比分类变量承载更丰富、更准确的信息,但同时也可能增加模型的复杂性和难度或者外行人难以理解。研究者可以通过观察建模过程中的一些预测因素,进一步调整变量类型,从而优化模型。
加工特征变量的工作比例
四
第四阶段:预测模型的建立。
虽然在选择预测目标变量和确定预测模型方面没有全行业一致的指南,但我们可以借鉴统计分析的概念。根据预期用途,将问题求解方法定义为分类预测模型、线性预测模型和风险预测模型。建立临床预测模型的几点建议:
所有的候选变量都包含在模型中,一些不重要的候选变量可以通过逆向淘汰或逐步选择的方法去除。包含所有候选变量可以避免过度拟合和选择偏差。模型的拟合程度可以通过参考赤池信息准则(AIC)和贝叶斯信息准则(BIC)来检查。AIC是模型拟合的一个指标。通常,AIC值越低,模型拟合越好。有人认为AIC涉及解释,而BIC涉及预测,其中BIC可视为贝叶斯算法的相应指标。如果研究人员对高级算法比较熟悉,可以考虑用机器学习算法进行模型拟合。根据响应变量(因变量Y)的类型,可以分配不同的建模算法。类似研究中常用的算法如下。
常见算法和特征
五
第五阶段:模型评估与验证(内部/外部)模型生成后,研究人员应使用独立的测试数据集来评估其提出的模型的预测能力。不同类型的问题有不同的评价指标,可以反映模型不同方面的特点。下面分别列出分类问题和回归问题的评价指标。在实际的建模工作中,还需要了解各个指标的含义,并对这些指标进行合理的解读。
分类问题中的指标
回归问题中的指标
预测模型的验证及应用方向
由于模型开发的复杂性,咨询数据科学家和统计专家可以提高预测模型研究的有效性和整体质量。在开发模型之后,在使用模型之前,我们应该使用尽可能多的外部数据集,并有效地传播给相关方。临床预测模型的应用场景不限于医疗机构。基于中国目前的情况,Web或智能移动应用程序可以更好地成为向公众宣传和普及预测模型的重要渠道。希望本文的内容能够帮助医生和研究人员对临床预测模型有一个初步的了解,并能够支持实际的科学研究。在未来的推文中,我们将详细介绍预测模型中使用的回归方法和算法的主题。
参考文献:moonskg,Royston P,Vergouwe Y,格罗布·比德,奥特曼DG。预后和预后研究:什么、为什么和如何?BMJ 2009;338:b375。Hemingway H,Croft P,Perel P,Hayden JA,Abrams K,Timmis A,等。预后研究策略(进展)1:研究临床结果的框架。BMJ青奥会;346:e5595。Greenland S .对成本效益预测重新定位的需要:对M. J. Pencina等人的“评估一种新标记物从ROC曲线下面积到重新分类及以后的额外预测能力”的评论,医学统计学(DOI: 10.1002/sim.2929)。统计医学2008;27:199-206.格里芬SJ,小PS,黑尔斯CN,金月AL,韦勒姆新泽西州。糖尿病风险评分:全科医疗中二型糖尿病的早期检测。糖尿病代谢研究2000年修订版;16:164- 71.小戈夫·DC、劳埃德·琼斯、贝内特·G、科亚迪·S、达戈斯蒂诺·RB、吉本斯·R等,2013年美国心脏病学会/美国心脏协会心血管风险评估指南:美国心脏病学会/美国心脏协会实践指南工作组报告。循环2014;129 (25补编第2号):S49-73。迈向更好的临床预测模型:发展的七个步骤和验证的ABCD。欧洲心脏杂志2014;35:1925-31.我们验证一个预后模型意味着什么?统计医学2000;19:453-73.斯特耶伯格。临床预测模型:开发、验证和更新的实用方法。纽约:斯普林格;2009.Steyerberg EW,Moons KG,van der Windt DA,Hayden JA,Perel P,Schroter S,等。预测研究策略(进展)3:预测模型研究。PLoS Med 201310:e1001381。柯林斯GS,赖茨马JB,奥特曼DG,月亮KG。个体预后或诊断多变量预测模型的透明报告(TRIPOD):TRIPOD声明。Ann实习生Med 2015162:55-63.李YH,邦H,朴YM,Bae JC,李BW,康ES,等。非酒精性脂肪性肝病的非实验室自我评估筛查评分:发展,验证和与其他评分的比较。PLoS One 20149:e107584。Bang H,Edwards AM,Bomback AS,Ballantyne CM,Brillon D,Callahan MA,等。糖尿病风险患者自我评估评分的开发和验证。Ann实习生Med 2009151:775-83.Kotronen A,Peltonen M,Hakkarainen A,Sevastianova K,Bergholm R,Johansson LM,等.利用代谢和遗传因素预测非酒精性脂肪性肝病和肝脏脂肪.胃肠病学2009;137:865-72.回归建模策略:应用于线性模型、逻辑回归和生存分析。纽约:斯普林格;2001.主要血管手术后心脏事件的预测因素:临床特征、多巴酚丁胺超声心动图和β-受体阻滞剂治疗的作用JAMA 2001285:1865-73.解释还是预测?统计科学2010年:289-310。Heikes KE,Eddy DM,Arondekar B,Schlessinger L .糖尿病风险计算器:检测未诊断糖尿病和糖尿病前期的简单工具。2008年糖尿病护理;31:1040-5.统计建模:两种文化(作者有评论和反驳)。统计学家Sci 200116:199-231.Steyerberg EW,Vickers AJ,Cook NR,Gerds T,戈宁M,Obuchowski N,等,《评估预测模型的性能:传统和新方法的框架》。流行病学2010;21:128-38.一种新的肝脂肪变性诊断评分的开发、外部验证和比较评估。美国胃肠病学杂志2014;109:1404-14.Hilden J .评论:关于NRI、IDI和“好看”的统计数据,下面什么也没有。2014年流行病学;25:265-7.
欣赏医学的美好,快乐学习生活。欢迎关注微信官方账号【樊棋医学BioSCI】。微信官方账号专注于生物医学研究、科研项目设计、SCI论文写作等领域的知识梳理和数据分享。,为医务工作者提供了方便。