在医疗领域,机器学习的方法已经不再陌生。多年来,决策树和逻辑回归等传统方法一直在医疗领域被广泛应用。近年来,随着深度学习技术的进步,一系列新的应用逐渐涌现,如利用复杂的医学记录预测有害症状和疾病的发生,提升基因测序的精度,甚至发现一些以前未知的疾病因素,比如心血管风险因子和眼底视网膜照片中的折射误差。
除了这些研究之外,如何将这些应用有效整合到医疗诊断流程中同样重要。已有研究表明,机器学习模型可以在糖尿病眼病分级和转移性乳腺癌诊断中辅助医生做出更准确的判断。医生还可以借助基于机器学习的交互式工具来检索类似的病例图像,从而大幅提升工作效率。
为了促进机器学习与医学的交叉研究,谷歌的研究人员在《自然》和《美国医学会杂志》上发表了两篇文章,介绍如何开发更适用于医疗健康领域的机器学习应用,同时为医护人员提供更多关于机器学习的知识,以及如何利用这些工具提高工作效率。
对于开发者和机器学习研究人员来说,深入理解医疗行业的具体需求至关重要。这包括问题的选择、数据的收集、模型的构建,以及验证、测试、部署和监控等多个环节。首先,需要明确哪些临床问题具有重要的价值,并且可以通过机器学习有效解决。例如,机器学习可以帮助识别糖尿病性眼病的症状,减轻医生的工作压力,缓解医疗资源紧张的问题。
一旦明确了问题,就需要仔细制定数据策略,确保基准标签或参考标准的准确性和可靠性。这可以通过专业人员的解读来验证标签的正确性,通过专家对比相同的数据,例如视网膜造影成像,或通过其他方法确认放射结果。高质量的参考标准对于医学应用至关重要,因为它们直接影响到模型训练的成功与否以及模型性能的评估准确性。因此,机器学习开发者需要与临床专家紧密合作,确保在训练和评估过程中使用准确的数据参考标准。
除了训练,模型的验证在医疗领域尤其重要,因为医疗数据的分布往往会有显著的偏移。与一般的机器学习任务不同,医疗应用通常会使用多个独立的测试数据集,每个数据集包含不同数量、地域、种族或亚型的病人。因此,机器学习人员需要与临床专家共同设计研究,关注模型验证和性能设计,以适应临床实际情况和需求。
在获得有效的模型之后,基于机器学习的辅助工具需要精心设计,以便能够无缝集成到诊断流程中,同时兼顾诊断准确性和工作流程效率。此外,真实世界的应用情况将为未来的研究提供宝贵的经验,帮助人们更好地了解工具的实际效果。
然而,开发过程并未结束。在功能验证和工作流程整合之后,还需要进行监管审批和持续监控,以应对可能出现的意外错误或异常情况。
对于医务人员而言,了解机器学习的基本概念和功能是非常重要的。除了增加对这些工具的信任外,还需要理解它们的局限性。医生们常常会询问参考标准是否可靠,测评方法是否无偏,不同患者之间的比较是否公平,以及模型是否已经在他们所面对的患者群体中进行了测试。机器学习模型如何帮助医生更好地治疗病人?
除了这些问题,机器学习模型还需要仔细审查其超参数设置。超参数调优是否与最终的测试结果无关?这对机器学习,尤其是深度学习来说尤为重要。不适当的超参数调优可能导致模型过拟合,即模型“记住”了训练数据,但在新数据上的表现却很差。因此,确保正确的超参数调优需要特别注意,尤其是在应用熟悉的术语时。
人工智能的发展使得科研到临床的道路日益加快,但这一过程需要多学科的合作。研究人员希望通过这些开发经验促进医生和开发者之间的相互理解和合作,推动更深入和长期的合作,最终造福患者。
如果您是医生,希望了解更多关于机器学习的知识,请参考以下链接: https://jamanetwork.com/journals/jama/article-abstract/2754798
如果您是机器学习领域的专业人士,希望了解更多的医学应用开发经验,请参考以下链接: https://www.nature.com/articles/s41563-019-0345-0