机械学习在临床医药治愈中的研发进展
发布日期:2022-10-21 作者:康为 点击:
引用本文: 吴行伟, 刘馨宇, 龙恩武, 等. 机械学习在临床医药治愈中的研发进展 [J] . 中国全科医学, 2022, 25(2) : 254-258. DOI: 10.12114/j.issn.1007-9572.2021.01.309.
近年来,紧随临床数据体系的创建和改善,医疗信息的可用性不停提升。但是,牵连医药治愈结果的原因繁重,且各原因之间也许存在交互功效。因而,对医药治愈流程中构成的真正世界信息进行解析时,面对高维度、大样件、共线性等高难问题。这类问题促使临床药师在高难的临床状况下,难以对医药功效的成效微风险进行有效的初期辨认和预判,进而牵连医药治愈结果,造成重病进程放慢、负责加剧、抱病率和灭亡率升高、住院时间延续[1,2,3,4]等问题显现。
机械学习成为人工自动的中心技术,因为其在解决高维度、大信息等方面的独到优势,越来越多地被运用于解析医药治愈流程中患者高难的临床特点和用药状况。本文对机械学习在临床医药治愈中的进展和成果给予综述,内容含盖医药处方和用药剂量、医药不良反应、医药疗效、耐药性、医药互相功效和用药依从性等,为临床医师及药学同行展开基于机械学习的预判模型研发供应方式和形式的考虑。
1 机械学习概括
机械学习由计算机科学家Arthur Samuel于1959年提出,其被描绘为"计算机在没有编程的状况下的学习本领"[5],可被解读为基于真正世界信息或往常的经历开发信息驱动的算法,以学习和模拟人类的言行[6]。依据学习方法的不同,机械学习划为有督促学习、无督促学习和加强学习等。督促学习即填写批量带有标签的样件信息以创建1个模型并获得对应流出值,首要被拿来解决分类和回归任务,常见的算法有逻辑回归、追随向量机和K—临近算法等[7]。无督促学习即通过填写无标签的信息来学习信息的内在构造和关联,其更多地被拿来解决聚类和降维问题,常见算法含盖K—均值聚类和希望最大化聚类等[8]。加强学习即依据状况和动作计算获益,将获益反馈到模型并对模型作出调节以获取最大的嘉奖信号,常见算法含盖Q学习并且时间差学习等[9]。成为机械学习的分类之一,近年来深度学习在医学行业的运用获得了较大顺利。其通过在填写层与流出层之间应用暗藏层来对信息的旁边表征进行建模,用来有督促或无督促的特点学习、表示、分类和形式辨认等,常见算法有深度神经网络、循环神经网络和卷积神经网络等[10]。
2 机械学习在临床医药治愈中的运用
2.1 医药处方和用药剂量预判
在医药处方预判方面,特别对于慢性病的逐渐治愈形式,常应用序列形式发掘和深度学习技术等方式来推理医药之间的时间联系,并形成规则来预判患者将会被处方的下一类医药[11]。WRIGHT等[12]学者应用序列形式发掘方式,运用SPADE(Sequential Pattern Discovery Using Equivalence Classes)算法从医药类型和仿造药程度发掘2型糖尿病患者医药处方的序列形式,该算法可以发掘适合指南举荐的医药治愈形式且无需患者的一切用药史。在医药类型预判方面,SPADE可以预判出90%的患者所用的医药;在仿造药预判方面,可以预判出64.1%的患者所用的医药。BEAM等[13]学者将机械学习和自然话语解决相结合,以提炼患者的归并症、用药史及医师的处方偏好。通过掂量患者和医师原因,研发牵连安眠药处方形式的医患原因,以更深入了解医师的处方言行。YELIN等[14]学者应用梯度加强抉择树推导的一类算法对尿路传染患者的信息进行解析发掘,通过筛选抗生素耐药性的特点,举荐最好的经历性治愈医药,通过该算法举荐的处方准确应用抗生素的几率比医师高4%,减低了医药错配危害。ROUGH等[15]学者依据住院患者的电子健康记载中的构造化数据,借用深度学习序列模型预判患者的特定用药次序,该算法可以发掘出与指南一致的医药治愈形式,因而,在出院时能够成为初期预警工具预判入院用药品种,以便监测将要处方的医药,减小反复用药或漏掉用药等。另外,朱立强等[16]学者采取非线性逻辑回归和追随向量机的方式创建了Ⅰ类切口手术患者应用抗菌医药合感性的评估模型,使抗菌医药防备应用率下落了7.41%,医药品类选用合理率提升了16.53%,应用疗程变短了1.75 d。
针对个人差别大、治愈窗窄、毒性很强的医药,对给药剂量进行准确预判可在绝对水平上减小不良事情的产生。MA等[17]研发者应用堆栈泛化框架集成了追随向量机、随机树林、近邻算法和梯度提高树4种算法,结合患者的临床特点和遗传信息预判华法林剂量,该算法应用于华法林低剂量保持治愈的患者,相比于其余患者,其在实际安稳治愈剂量20%以内的患者中预判本领提升了12.7%。ROCHE-LIMA等[18]学者应用7种机械学习方式,通过回首性解析心血管重病患者的临床特点和遗传信息来预判华法林的应用剂量,该研发以平均一定偏差和预判确切率来评价模型功能,结果显现,随机树林回归、多元自顺应回归样条(multivariate adaptive regression splines,MARS)和追随向量回归的预判确切性优于其余算法。TAO等[19]学者创建了一类集成学习模型,以相似的掂量指标评估了模型对中国人群华法林应用剂量的预判功能。SU等[20]学者回首性解析了2个重症监护病房研发信息库中的患者信息,应用随机树林、追随向量机、自顺应加强算法、极限梯度加强和浅层神经网络5种机械学习方式,以部份凝血活酶时间成为预判因子来预判肝素的治愈成效,结果显现,浅层神经网络以最高的F1值成为预判肝素治愈成效的最适模型,该模型可用来优化患者的肝素剂量。另外,LEVY等[21]学者连接受抗心律失常医药多非利特治愈的患者的临床信息进行了解析,与多种督促学习方式较为,一类深度加强学习算法—Q学习算法以96.1%的确切度更好地预判了多非利特的应用剂量。
2.2 医药不良反应预判
医药不良反应不单是医药开发落败和医药上市后撤市的首要原因,也是医药治愈落败和治愈自愿停止的原因。紧随医药不良反应信息库的显现,有督促的机械学习算法已被全面用来医药数据提炼和医药不良反应的联系预判[22,23]。该类研发首要基于医药生物学特点、化学特点和表型特点等创建预判模型对医药不良反应进行预判[24]。
医药性肝伤害(drug induced liver injury,DILI)是最常见的不良反应之一,批量的基因表示信息为初期辨认和确切预判DILI供应了有价值的数据。HAMMANN等[25]学者基于医药化学构造,建立了抉择树、K-临近算法、追随向量机和人工神经网络4种机械学习模型以预判DILI,此中抉择树模型实行了89%的准确分类率。FENG等[26]学者基于Array Express信息库中的基因表示信息创建了深度学习模型来预判DILI,该模型在确切率、准确度和有关系数等方面均显著优于追随向量机模型,并通过外部信息集和植物试验对模型功能进行了验证。LAI等[27]研发者将结核患者的临床特点和基因组信息相结合,创建并较为了人工神经网络、追随向量机和随机树林3种模型匹敌结核医药肝毒性的预判功能,此中人工神经网络体现最好。DAVAZDAHEMAMI等[28]学者将时序医药警戒网络和机械学习技术相结合,预判8种常见高危害医药的医药不良反应,结果显现,梯度加强树辨认医药不良反应的确切率高达92.8%。
2.3 医药疗效预判
在医药疗效预判时,常将患者临床病症和体征的改进,并且试验室检验指标的改变成为待预判结果,以评价医药疗效。另外,还可运用机械学习方式发掘现有临床实验信息或电子病历体系中的信息来创建预判模型,对特定患者的特定医药疗效进行回首性解析和前瞻性辨认,进而对医药疗效进行精确评估。
CHEKROUD等[29]研发者筛选了烦闷症患者的25个临床特点并创建了梯度提高机模型,以评价患者应用西酞普兰治愈12周后病症能否减缓,该模型的预判确切率为64.6%。若将抗烦闷治愈反应的生物标注物成为预判变量,也许会获取更高的预判确切性。ATHREYA等[30]学者论证了将机械学习与医药基因组生物标注物相结合的可行性,以实行对两类新式抗烦闷药西酞普兰和依他普伦8周治愈成效的预判。SAKELLAROPOULOS等[31]学者将基因表示信息与医药反应相结合,建立了深度神经网络模型以预判癌症患者的医药治愈反应,并在多个临床队列上进行了外部验证,结果标明,深度神经网络在医药治愈反应预判方面优于传统的机械学习算法。JIANG等[32]学者创建了追随向量机模型,用来辨认对5-氟尿嘧啶/奥沙利铂高度敏感的胃癌患者,该模型可将Ⅱ期和Ⅲ期胃癌患者进行确切分类,应用该模型预判的不同类型患者的5年无进展生存期和总生存期存在明显的统计学差别。
2.4 医药耐药预判
紧随高通量测序技术的成长,医药基因组学有关信息库的创建和改善,并且电子病历体系中大范围信息集的积累,机械学习现已被全面运用于抗菌医药和化疗医药等敏理性有关的基因型/表型预判、临床抉择的制订和医药治愈计划的优化等方面[33]。
DAVIS等[34]学者创建了Ada Boost机械学习模型,用来辨认鲍曼不动杆菌对碳青霉烯类抗生素、金黄色葡萄球菌对甲氧西林并且肺炎链球菌对β-内酰胺类抗生素和复方新诺明的耐药性,实行了88%到99%的确切率。此外,该研发还将结核分枝杆菌对异烟肼、卡那霉素、氧氟沙星、利福平和链霉素的耐药性进行了预判,实行了71%到88%的确切率。CHOWDHURY等[35]学者提出了重叠的集成模型,以逻辑回归、抉择树和追随向量机成为基线模型,基于蛋白质序列的类似性来预判结核分枝杆菌对卷曲霉素的耐药性;与最好的基线模型追随向量机相比,集成模型预判确切性提升了2.43%。MANCINI等[36]学者创建了Cat Boost、追随向量机和神经网络3种机械学习模型,并集成了1个云平台来预判患者住院后产生多药耐药性尿路传染的危害。AN等[37]学者通过对58万余例癫痫患者的索赔信息进行解析,以预判患者在初次开具某种抗癫痫医药时耐药的危害,其训练的随机树林算法体现最好。DORMAN等[38]学者研发了紫杉醇和吉西他滨的生长抑止浓度与基因表示之间的有关性,该研发应用多原因主成份解析筛选出"强关联"的基因,应用追随向量机来预判医药的敏理性,对紫杉醇和吉西他滨敏理性的预判确切率分别为70.2%和57.0%。
2.5 医药互相功效预判
在联合用药状况下,医药互相功效往往是造成医药不良反应产生和医疗本钱加大的常见原因。因而,辨认医药互相功效是减小医药不良事情和提升患者用药安全性的要害。固然已有文献研发成果和可获得的医药互相功效信息库可为机械学习的运用供应根基,但对医疗信息中的医药互相功效研发仍比较缺少。
CHENG等[39]学者通过调整医药互相功效信息库中的医药表型、治愈、化学和基因组学类似性,提出了一类异构网络辅助推断(Heterogeneous Network-assisted Inference,HNAI)框架,在该框架中运用了朴实贝叶斯、抉择树、K-临近算法、逻辑回归和追随向量机5种机械学习模型来预判医药互相功效,此中HNAI模型ROC曲线以下积为0.67。KASTRIN等[40]学者基于Drug Bank、KEGG和Two sides等5个医药互相功效信息库中医物间的拓扑和语义类似性特点,较为了分类树、K-临近算法、追随向量机、随机树林和梯度提高机模型的预判成效,结果显现,随机树林和梯度提高机对Two sides网络的预判功能最好。RYU等[41]学者创建了深度学习模型,通过填写医药-医药对或医药-食物对的名字及其构造数据,形成了86种医药互相功效,并对模型进行了外部验证,预判确切率平均为92.4%。
2.6 医药依从性预判
患者医药依从性差是广泛存在的问题。优良的用药依从性针对重病的治愈和治理至关首要。有研发者尝试应用机械学习算法来辨认医药依从性差的患者,进而有对于性地制定提升医药依从性的方略。
TUCKER等[42]学者采取抉择树、K-临近算法、朴实贝叶斯、追随向量机和随机树林模型,依据帕金森病患者应用非穿戴式多形式传感器接收的步态特点来创建预判模型,实行对患者用药依从性的近程监管。MOHEBBI等[43]学者基于持续葡萄糖监测信号,创建多层感觉器和卷积神经网络模型对2型糖尿病患者应用胰岛素的依从性进行预判,结果显现卷积神经网络的预判功能最好。LI等[44]学者应用机械学习方式辨认应用降压药不依从的亚组人群,以制订对于目的人群的干预手段。WU等[45]学者采取30种机械学习方式创建了300个模型来预判2型糖尿病患者的用药依从性,以用药具有率对患者的用药依从性进评估,结果显现,集成算法预判功能最好。
3 小结
紧随计算机技术的不停成长,机械学习在辅助临床医药治愈抉择方面呈现出了较大的后劲。此类方式为医师和临床药师制定医药治愈方略、应付医药不良反应、监测医药治愈成效和优化医药治愈计划等供应了抱负的工具。现在,机械学习在临床医药治愈方面的研发首要基于医院电子病历体系、基因组学信息库、医药互相功效信息库和医药不良反应信息库等,采取机械学习的方式,特别是深度学习算法,创建临床预判模型以实行对目的人群或目的医药的预判。但因为现在我国医院电子病历体系等信息库缺少标准体系的患者数据录入过程、有效的信息质控流程和信息孤岛等缺点,整体信息借用率有待提高。
另外,医学机械学习是一项交叉学科,研发者常需把握计算机、线性代数、几率论与数理统计等专业常识。因而,机械学习在医疗行业的全面运用尚存在较大的学科壁垒,常显现"医疗工作者不懂机械学习,计算机工程师不懂医学"的情况。开发医疗工作者简捷易用的机械学习建模工具也许是减缓该问题的有效手段。
将来,紧随高端量信息库的创建和新算法的开发,通过临床科研职员与计算机研发职员的有机合作,机械学习有望更多地运用于临床医药治愈的研发中。借助于优质的机械学习算法和工具,可有效提升临床预判模型在临床实践中的实用性,提升诊断效益,实行个人化治愈抉择的自动化。
本文文献检索方略:
英文检索词:machine learning、supervised learning、unsupervised learning、semi-supervised learning、deep learning、drug、medicine、prescription、dosage、dose、ADR、adverse reaction、therapeutic effect/response、treatment effect/response、drug resistance、DDI、drug interaction、drug-drug interaction、compliance、predicting、predict、prediction,结合运算符(AND、OR和NOT)检索PubMed信息库,共检索3 352篇文献;中文检索词:机械学习、督促学习、无督促学习、半督促学习、深度学习、医药、医药处方、医药剂量、医药不良反应、医药疗效、耐药性、医药互相功效、用药依从性、预判,结合运算符(AND、OR和NOT)检索中国知网、万方信息常识服务平台和维普网,共检索104篇文献。检索时间为2010—2020年。
利益矛盾
本文无利益矛盾。
考虑文献 略