对乳腺癌的早期筛查一直是机器学习领域的热门研究方向,但现有的筛查模型大多依赖于白人女性的数据,这导致对非白人女性的筛查准确率较低。
最近,麻省理工学院的研究团队开发了一种新模型,不仅解决了这个问题,还能提前五年检测出乳腺癌患者。
这项突破性研究展示了深度学习技术如何推动医学进步,使早期诊断和针对性治疗成为可能,从而显著改善患者的预后。
该研究由Regina Barzilay教授和Lehman教授以及CSAIL博士生Adam Yala共同完成。
过去,大多数疾病筛查模型都是基于卷积神经网络(CNN)的改进版本。CNN是一种前馈神经网络,模仿人类视觉系统处理图像的方式。卷积层提取图像的边缘、轮廓等信息,激活函数则模拟大脑对外界信号的响应。随着网络层次加深,模型可以从局部到全局提取更多图像特征。这种模型在图像分类任务中表现出色。
然而,这些模型大多基于白人女性的数据集,忽略了其他族群的数据,这导致对非白人女性的筛查准确率不高。
麻省理工学院的研究团队注意到,黑人女性死于乳腺癌的风险比白人女性高出42%。这是由于现有模型主要针对白人女性,忽视了黑人和其他少数族裔的数据。
为此,研究团队开发了一种新模型,旨在提高对少数族裔健康评估的准确性。该模型在黑人和白人女性中均表现良好,证明其在不同族群中的普适性。
Regina Barzilay教授本人是一位乳腺癌幸存者,她希望这种系统能帮助医生在个体层面上制定筛查和预防计划,从而实现早期诊断。
尽管乳腺癌主要影响女性,但所有性别都存在患病风险。乳腺癌风险评估主要依赖于年龄、家族史、激素和生殖因素等指标。然而,这些因素与乳腺癌的相关性较弱,因此现有模型在个体层面的准确性有限。
相比之下,麻省理工学院的模型可以直接从数据中识别出未来可能发展成癌症的模式。该模型基于超过六万名患者的数据集,其中包括九万多份乳房X光片和患者的病情进展记录。这使得模型能够识别出一些人类医生难以察觉的早期迹象。
麻省理工学院的研究团队并没有手动识别乳房X光片中的关键特征,而是通过深度学习模型直接从数据中提取这些信息。这一模型基于麻省总医院提供的大量数据,其中包括乳房X光片和患者的病情进展记录。
该模型不仅能识别出人类医生难以察觉的早期病变,还能够在预测性诊断和预筛查方面提供更高的准确性。
总体而言,麻省理工学院的研究团队开发的这一模型旨在帮助医生为患者提供更早、更准确的治疗方案,而非等到病情恶化才告知患者。
此外,近期的研究显示,通过对BRCA1和BRCA2基因突变的检测,可以更有效地展开乳腺癌的治疗。
展望未来,麻省理工学院的研究团队希望将这项技术应用于其他疾病的预测,例如通过扫描脑部结构预测阿尔茨海默病和多发性硬化症,甚至可以应用于心血管疾病的预测。
相关报道链接: - MIT新闻 - TechCrunch