华中科大AI模型预测新冠生存率准确率90%,有助早期介入!
发布日期:2022-03-11 作者:WLT 点击:
当地时间3月17日,预印医疗平台medRxiv发布了一项名为“基于机器学习的严重co vid-19感染患者生存预测模型”的研究成果(未经同行评审)。这项由29名科学家共同进行的研究,利用最新的可解释机器学习算法,揭示了预测新冠肺炎(新冠肺炎)患者存活率的生物标志物,有望加强新冠肺炎高危患者的早期干预,降低死亡率。
研究团队来自华中科技大学同济医学研究所附属同济医院,华中科技大学人工智能与自动化学院,剑桥大学植物科学学院等。本文作者为华中科技大学人工智能与自动化学院教授袁烨、同济医院麻醉科徐辉、医学急诊(重症)科主任李树生。
研究人员收集了来自武汉同济医院的404名新冠肺炎感染患者的血液样本,并对其进行了回顾性分析。通过机器学习工具,研究团队最终选择了三种生物标志物来预测个体患者的生存率,准确率超过90%: LDH(乳酸脱氢酶)、淋巴细胞和hs-CRP(高敏C反应蛋白)。
特别是,只有高LDH水平的指标可用于区分需要立即治疗的绝大多数病例。研究人员表示,这一发现与目前的医学知识相一致,即LDH水平高与各种疾病中的组织分解有关,包括肺炎等肺部疾病。
在现阶段,对疾病的严重程度进行快速、准确和早期的临床评估是非常重要的。然而,目前还没有明确的生物标志物作为区分需要立即就医的患者的标准。
在这项研究中,作者使用最先进的机器学习框架表明,上述三种生物标志物可以准确预测疾病的严重程度,从而大大减轻临床参数监测和其他相关医疗负担的压力。
研究人员开发了一种基于XGBoost机器学习的预后模型,通过使用患者的最新血液样本,可以预测新冠肺炎重症患者的存活率,准确率超过90%。使用其他血液样本可以达到90%的预测准确率。
本研究提出了一个简单可操作的公式,可以快速发现新冠肺炎高危患者,早期干预,尽可能降低其死亡率。
研究样本和模型训练
研究人员进行了一项分类任务,输入普通、重症和危重疾病患者的基本信息、症状、血液样本和实验室检查结果(包括肝功能、肾功能、凝血功能、电解质和炎症因子),并将其与测试期结束时的临床后果(存活或死亡)对应起来。
研究样本为同济医院于2020年1月10日至2月20日收集的404例患者的医疗信息。在这404名患者中,213名康复,其余191名死亡。作者指出,高死亡率与同济医院作为定点医院有关,它治疗最严重的病例。研究人员使用标准病例报告表来收集医疗记录,包括流行病学、人口统计学、临床、药物、护理和死亡率信息。
研究人员使用375名患者的信息进行算法开发,并使用29例进行验证。
研究人员将患者数据分为训练集、测试集和其他附加验证集。共有375名患者被包括在训练集和测试集中,而29名患者被包括在验证集中。按照7: 3的比例设置训练集和测试集的样本数,然后进行5次交叉验证。
验证组的患者都是重症患者,因为就临床结果而言,他们是最不可预测的。从临床症状来看,发热是最常见的首发症状(49.9%),其次是咳嗽(13.9%)、乏力(3.7%)和呼吸困难(2.1%)。375例患者的年龄分布为58.83±16.46岁,其中男性占58.7%。患者中37.9%为武汉市居民,6.4%为家庭聚集性病例,1.9%为医疗务工人员。
患者的年龄、性别、流行史等特征。
虽然大多数患者在整个住院期间收集了多个血样,但模型训练和测试仅使用患者的最新血样记录作为输入,以获得评估疾病严重程度的关键生物标志物,区分需要立即医疗援助的患者,并准确匹配每个标签的相应功能。
患者三种生物标志物的中值,以及25和75的百分位数。
与死亡风险最相关的临床特征
研究人员使用名为XGBoost的分类器作为预测模型。XGBoost是一种高性能的机器学习算法,由于其基于树型方法的递归决策系统,具有很大的可解释性。模型的输出对应于患者的生存状况。研究人员将存活的患者归类为0,死亡的患者归类为1。
研究者之所以没有采用黑盒建模策略,是因为其内部建模机制通常难以解释。在XGBoost中,每个函数的重要性取决于它在树的每个决策步骤中的累积使用量。通过这种方式,可以获得一个度量来表征每个特征的相对重要性,这对于评估模型结果中最显著的特征尤其有价值,尤其是当研究与临床医疗参数相关时。
为了评估死亡风险的标志,研究人员通过特征选择过程评估了每个患者参数对算法决策的贡献。XGBoost根据函数的重要性对其进行排序。该算法选择三个顶级临床特征:LDH、淋巴细胞和hs-CRP,因此它们被设置为关键特征。
根据其在多树XGBoost算法中的重要性,研究人员排列了十大关键临床特征,LDH、淋巴细胞和hs-CRP排在前三位。
结果表明,在不考虑入院时的初始诊断的情况下,该模型可以准确地预测患者的预后。
此外,附加验证集的性能类似于训练和测试集的性能,这表明该模型捕获了与患者生存相关的关键生物标志物。同时,算法结果进一步强调了LDH作为患者存活率关键生物标志物的重要性。
训练/测试拆分和附加验证集三个关键特征的模型性能,F1-score是算法准确率和召回率的调和平均值,最高为1,最低为0。
根据对LDH、淋巴细胞和hs-CRP重要性的发现,研究人员进一步构建了一个可以应用于临床的简化决策模型,即单决策树。因为24名患者的三个主要生物标志物中至少有一个是不完整的,所以研究人员用剩余的351名患者确定了XGBoost模型。
简单来说,研究人员选择模型中性能最好的树,利用三个关键特征及其阈值来预测患者的死亡或存活。
根据测试数据集及其准确性选择具有最佳性能的树
该模型显示了100%的死亡率预测准确性和90%的生存预测准确性。总体来看,无论是多树XGBoost模型还是单树XGBoost模型,模型对于生存和死亡预测的准确率、宏观和加权平均得分始终超过0.90。
最后,大多数患者在住院期间接受了多个血液样本。研究人员用成千上万的额外血液测试结果验证了该模型,发现预测准确率达到90%。此外,相关结果进一步表明,无论患者的临床结果如何,该模型都可以应用于任何血液样本。
尽早识别高风险患者,并快速确定优先级。
研究人员表示,这项研究的意义是双重的。首先,一般的相关研究只会“提供高危因素的范围”,而这个模型提供了一个简单直观的临床测试,然后可以准确快速的量化死亡风险。
如果医生能够提前知道某些治疗方法会导致某些患者治疗效果不理想,那么医生就可以在病情变得更严重之前采取不同的方法。应用该模型的目的是在不可逆病变发生前识别高危患者。
其次,任何医院家族都可以很容易的收集到患者的LDH(乳酸脱氢酶)、淋巴细胞、hs-CRP(高敏C反应蛋白)的信息。这个简单的模型可以帮助在拥挤的医院中医疗资源短缺的情况下,快速确定患者的优先级。
患者体内LDH水平的升高可以反映组织或细胞的破坏,这被认为是组织或细胞损伤的共同标志。血清LDH已被确定为特发性肺纤维化严重程度的重要生物标志物(IPF)。
在严重的肺间质疾病患者中,LDH的升高是显著的,并且它是肺损伤的最重要的预后指标之一。因此,对于重度新冠肺炎患者,LDH水平的升高表明肺损伤的严重程度增加。
研究小组指出,较高的血清hs-CRP也可以用来预测重症新冠肺炎患者的死亡风险。hs-CRP的升高是ARDS患者预后不良的重要标志,反映了炎症的持续状态。
值得注意的是,这种持续炎症反应的结果可以从新冠肺炎死者的尸检中看出,即肺部出现大量灰白色病变,组织切片中也可见大量肺泡的粘稠分泌物。
最后,研究结果还表明,淋巴细胞可能作为潜在的治疗靶点,这一点得到了临床研究结果的支持。此外,包括北京中日友好医院呼吸科主任曹斌在内的研究人员已经证明,淋巴细胞减少是新冠肺炎患者的常见特征,可能是与疾病严重程度和死亡率相关的关键因素。
与SARS和MERS患者肺泡穿透和抗原呈递细胞(APC)损伤的方式一样,新冠肺炎患者受损的肺泡上皮细胞可诱导淋巴细胞浸润,导致持续性淋巴细胞减少。
之前的一项患者活检研究表明,外周血中CD4和CD8 T细胞的数量大大减少,它们的状态是过度激活的。此外,一些研究表明,淋巴细胞减少主要与CD4和CD8 T细胞减少有关。因此,淋巴细胞在新冠肺炎中可能起着明显的作用,值得进一步研究。
作者说这项研究也有一些局限性。首先,因为这种机器学习方法是纯数据驱动的,如果我们从不同的数据集出发,模型可能会不一样。
另外,虽然作者掌握了80多个临床测量结果,但为了避免过拟合,团队采用的建模原则是在最少的临床测量结果数和良好的预测能力之间进行权衡,因此可能存在临床测量结果不够丰富的问题。
最后,本研究平衡了模型的可解释性和较高的准确性。虽然临床环境倾向于使用可解释的模型,但如果使用黑盒模型,准确性可能更高,但同时决策的风险也更高。
从技术角度来看,作者认为这项工作有助于使用机器学习方法预测和诊断正在经历大规模全球爆发的COVID 19病例。