互联网资讯 / 人工智能 · 2023年12月5日 0

AI医疗数据集小、可靠性差的信任问题

近年来,人工智能在医疗诊断领域的应用引起了越来越多的关注,并且已经出现了一些实际的应用案例,如药物筛选和AI辅助诊断。然而,AI医疗诊断的准确性似乎仍然难以达到预期。这其中的原因到底是什么呢?本文将探讨并汇总一些对AI医疗诊断的独到见解。

AI与医疗的结合作为一个新兴领域,展现出了巨大的发展潜力。虽然许多针对医疗的AI算法不断涌现,但在欣喜于其前景的同时,问题也逐渐暴露出来。

例如,为了帮助医生筛查潜在的新冠患者,研究者们开发了多种机器学习算法,旨在根据胸部X光片和CT图像快速准确地检测和预测新冠肺炎。然而,剑桥大学的一项研究指出,这些算法存在严重的缺陷和偏见,使其无法在临床应用中发挥作用。

事实上,致力于AI和医疗融合的研究者并不在少数,许多项目也获得了相应的投资,但该领域依然面临一些实际问题。最近一篇ReddIT帖子将AI医疗与AlphaZeRo进行了对比,引发了对AI医疗问题的广泛讨论。

数据集较小、需要认证、容错成本高……

有网友从数据集规模、人机交互、认证流程和容错成本四个方面与DeepMind的AlphaZeRo进行了全面的对比,指出了当前AI医疗诊断系统的一些基本问题。

为什么信不过AI看病?数据集小、可靠性差,AI医疗任重道远

首先,医疗数据集通常较小,这是由于医生标注的成本高昂所致。此外,医疗过程本身也极为缓慢。例如,一台核磁共振设备每小时最多只能进行两次扫描,每天不超过48次,每年仅有不到20000次的扫描。如果需要涵盖20种疾病,那么每种疾病分到的扫描图像不到1000张。而若想从多家医院收集数据,流程可能要花费数月时间,研究人员也没有足够的时间来填写各种表格。相比之下,AlphaZeRo的数据收集则简单得多,仅需进行游戏,每小时便能生成数百万个数据。

对此,其他用户表示赞同。有网友提到,自己曾见过一个MRI数据集,标注过程需要3位医生先进行标注,然后再由领域专家审核,这个过程耗时巨大。

其次,在人机交互方面,至少在可预见的未来,医疗诊断系统仍需要人类医生的参与。因此,除了进行诊断预测,医疗系统还需提供置信度、可能的其他结果以及任何有用的附加信息。目前如何有效处理这些信息仍然是一个未解的难题,而AlphaZeRo只需输出单一动作即可。

再者是认证问题。需要向决策者或医疗许可委员会「证明」医疗诊断系统的有效性。目前,解释神经网络的能力仍然是一个悬而未决的问题,甚至有人质疑是否可能实现这一点。而AlphaZeRo只需在游戏服务器上部署,或找人类玩家进行测试,无需任何批准。

最后是容错成本。如果医疗诊断系统出错,开发者可能面临数百万美元的索赔,因此必须确保系统的准确性。而AlphaZeRo在围棋游戏中输掉一局,只是简单的失误而已。

医疗诊断并非「一锤子买卖」

除了数据集大小、医疗认证和容错成本等宏观问题外,网友们还提到另一个关键问题:不同病患在诊断图像上可能表现出相同症状,导致医疗诊断系统有时会做出错误判断。

此外,不同机器或成像设备生成的图像分布可能大相径庭,因此在一台机器上正常运作的算法可能无法在另一台机器上有效应用。可解释性也是一个难题。即使算法得出正确的医疗结果,医生往往仍会询问算法的推理过程。

确实,诊断是一个极其复杂的AI或机器学习问题。病患的情况各不相同,症状也多种多样。因此,除了初步诊断外,医疗诊断系统还需提供进一步的诊断、治疗方案、预后及健康计划等智能支持。

在与健康安全息息相关的领域,AI医疗的可靠性是重中之重,但这一点常常被忽视。即使是病理样本分析,也常常存在一定的不确定性。仅对图像进行标注就可能引入各种偏见。即便经过多位专家达成共识,结果依然可能存在差异,并导致成本的显著增加。

医疗保健的问题极为复杂,AI目前更适合于日常生活,而非提供最终的医疗诊断和预测。一位医生网友表示:「在AI医疗领域发表的大部分论文几乎没有实际价值,但这些研究为未来提供了许多可能性。在接下来的几年中,这一领域的炒作可能会破裂,相关法规将提升AI工具在临床实践中的引入门槛。目前,虽然已经有一些产品获得了欧盟或FDA的支持,但尚未建立起临床支持。」

显然,将AI真正应用于医疗还有很长的路要走。