心肺复苏模型

新闻分类

准确率97%的开源肺炎检测模型:照搬PyTorch教程、50张图片就完了!

准确率97%的开源肺炎检测模型:照搬PyTorch教程、50张图片就完了!

发布日期:2022-03-11 作者:WLT 点击:

最近,一名澳大利亚人工智能博士候选人在LinkedIn上发表了一篇关于新型冠状病毒病毒的研究文章。由于其话题性和声称的97.5%的准确率,这篇文章迅速获得了数万条评论、点赞和转发。但是,这样的模型被拉出来,只用了50张图片进行训练。


1.jpg


一周内建立一个准确率97%的模型。事实是什么?

此前,澳大利亚一名人工智能博士候选人宣布构建了一套深度学习模型,可以从肺部x光片中以97.5%的准确率检测出患者是否感染了新冠肺炎病毒。因为国外疫情蔓延,医疗设施不足,所以人们对这个成绩非常关注。短时间内,他们收到了数万条评论、赞和转发。他们还创建了Slack工作组,获得了很多好评。

从目前发布的消息来看,整个项目有以下特点:一套训练好的Python模型容器化应用代码和一套GitHub库,已经翻译成多种语言的正在开发的Web应用和正在开发的移动应用规划蓝图,在AWS中托管这种无服务器架构的模型在营销和赞助方面有大量的后续计划。

而以上都是在一周内快速完成的。随后,Reddit用户挑出了这个解决方案中的几个严重问题,进行了整理和反驳。


2.jpg


只用50张图片训练?

首先,这些网络的潜在神经表示非常复杂,需要使用大量的训练样本来完成模型训练。但是截止到提交,这个新冠肺炎测试工具只看到了50个肺部图像。

对于这样一个超过150层,超过2000万个参数的网络来说,如此有限的训练样本集显然是可笑的。


3.jpg


该模型通过肺部X射线图像来学习。

样品有问题。

此外,样本中可能存在巨大的数据偏差。这50张图片并不包含相关人员是否感染病毒,只是根据新冠肺炎急性病例导致的肺部手术进行标注。除非肺部已经被病毒破坏,否则模型根本检测不出任何感染迹象。另外,即使肺炎的症状已经出现,如果不是急性症状,也无法证明这个模型的准确性。重复图像、代码混乱和模型问题。

最后,这个COVID模型基于流行的基准网络ResNet-50。虽然后者确实是图像识别和分类领域的常用方案,但ResNet的前期训练一般只覆盖日常环境中的物体。换句话说,ResNet网络中的隐层更擅长识别几何形状和彩色图像,而我们在x光图像中显然找不到这样的模式。正因为如此,大多数医学神经网络只能选择从零开始构建。

对这个代码库的进一步观察揭示了许多其他问题。训练、验证和测试数据集中存在重复图像,训练流程大多直接抄袭PyTorch教程,夹杂大量不必要的代码;Hubissues也完全不可理解...

GitHub地址:https://github.com/elcronos/COVID-19项目负责人回应:我说项目不可用。

最初,当个别开发人员与项目负责人沟通并提出问题时,对方回应说:

你好,xxx,我们的成果得到了加拿大xxx研究所放射科医生的支持和认可。

然而随着越来越多的质疑,项目负责人在GitHub中更新了介绍,说:

虽然这个项目的结果“看起来很有希望”,但我明确指出,这个模型还远远没有,所以不应该用于诊断或任何医疗决策。这是一项正在进行的工作,我们需要有相关技能的人的帮助。我也在GitHub的资源库中指出,我正在寻找能够改进和收集更好数据集的开发者的帮助。

不幸的是,这个项目引起了相关专家的注意。他们没有注意到模型还没有准备好,需要更好的数据集并帮助创建更好的模型,也没有阅读我们所有的免责声明。我指责这个项目有误导性,甚至有人暗示我有商业意图。这对我的个人生活造成了一些负面影响,所以我决定退一步,暂时退出社交媒体。至少接下来的几天,我不会在这个群里活动。

完整版声明参考:https://github.com/elcronos/COVID-19

然而,负责人仍在大力宣传该项目,并开始筹集资金。项目负责人创建了一个Slack讨论组,该讨论组有几个子渠道,包括一个专门用于沟通和筹款的#营销渠道。此外,#保荐人频道负责与潜在投资人沟通,报告其未来投资回报前景。

松弛讨论组:https://app.slack.com/client/T010AJ5H31N/learning-slack

除此之外,名为#datascientists的频道也没有多少有用的内容,里面全是热情但缺乏经验的新手。同样,#医生频道的情况也差不多。唯一有价值的内容是来自专业医疗人员的反对意见,比如不建议使用肺部x光诊断新冠肺炎感染。最后一个子通道#研究人员几乎是空的。

另一方面,UI/UX频道制作的内容相当丰富。目前,这个程序有五个不同的徽标,外加一组专用于移动和Web应用程序的界面。

所以,对于这种说法,大部分开发商并不买账。很多人认为,在目前的特殊情况下,这种问题严重的项目不应该进行发布和宣传(甚至有开发商调侃称,宣传的工作量是开发工作的20倍左右)。诊断中的医学深度学习

深度卷积网络在疾病的诊断和治疗方面确实具有一系列潜在的优势。近年来,许多科学出版物都对这一新的发展方向给予了高度关注:2016年,来自伦敦的一组研究人员发表了一种新方法,基于包含8万张眼底照片的数据集,可以以86%的准确率诊断糖尿病引起的视网膜病变。同年,来自乌干达的研究人员通过使用10,000个对象的数据集,评估了卷积神经网络(CNN)对微观血液涂片的分析能力。两名日本研究人员通过包含55万张CT扫描图像的数据集,对肺结节进行了大规模分类操作。

然而,前面提到的新冠肺炎测试完全不同。稍微浏览一下其公布的代码库,就能看出作者对深度学习和AI技术的认知严重不足。更糟糕的是,很多开发者都在质疑,他们显然是想利用这次爆发来推广自己。说好的代码改变世界?

深度学习绝不是最好的解决方案。近年来,无数毫无准备的企业匆忙组建数据团队,却发现成本在快速上升,却没有任何有意义的产出。

此前,李菲菲在一次采访中提到:

泡沫确实存在。过度的夸张和炒作可以说是铺天盖地。作为科学家,我希望这些泡沫尽快消散。只有注重实芯的人,才能推动AI进步,带来实实在在的收益,这一点在医疗医疗、医药等领域尤为重要。

此外,我们永远不应该利用技术来制造不公正、偏见或扩大现有的不平等。对于AI技术,希望降低其接触门槛,增加公平性,尽可能缓解各种相关矛盾。只要处理得当,我们完全有机会利用人工智能技术创造更美好的未来。当然,前提是我们要仔细梳理现有的AI成果,找出哪些是捏造的,哪些是真实的。

阅读:李菲菲最新访谈:希望AI领域的泡沫尽快消散,尤其是医疗部分。

时至今日,AI技术仍在开拓前进。忽略了这一点,很容易陷入炒作的泥潭。

说了这么多,任何一个理性的开发商都不会贸然进入,把自己的命运交给运气。相反,只有先建立一支在AI/ML、DataOps、架构、开发等领域有专长的团队,才能打赢这场仗。

最后,代码不能让世界变得更好也没关系,不要惹麻烦就好。

关注我,转发这篇文章。如果你相信我“收到信息”,你可以免费获得价值4999元的InfoQ迷你本!了解更多信息



本文网址:http://www.xizd.com/news/953.html

相关标签:医学神经,医学深度

最近浏览:

在线客服
分享