近期,阿里巴巴达摩院在癌症诊断领域取得了重大突破,推出了一款创新的多癌影像分析通用模型。这一模型能够一次性检测、分割并诊断八种主要的高发致死性癌症,显著提升了多癌统一诊断的效率,有效降低了漏诊的风险。
当前医疗人工智能技术已发展到足以识别单一器官疾病,辅助医生作出诊断,然而在处理多个器官的精确识别时遇到了挑战,主要是因为较高的误报率和一定程度的漏诊现象。这对癌症患者的整体诊疗带来了压力。为了减少误诊和漏诊,放射科医生通常需要对全身多个器官进行多病种的检测和诊断。因此,医生们迫切需要一种高效能的多癌统一诊断工具。
为解决这一难题,达摩院医疗AI团队联合了包括中山大学肿瘤防治中心、四川省肿瘤医院、浙大附属第一医院、盛京医院、广东省人民医院等在内的多家医疗机构,共同开发了名为“cancerUniT”的统一多癌影像分析通用模型。该模型以Mask Transformer语义分割为核心,解决了多种肿瘤图像在统一检测、分割和诊断上的难题,适用于肺、结直肠、肝、胃、乳腺、食管、胰腺和肾脏等主要癌症及其相关器官的肿瘤子类型。
多癌问题的复杂性在于器官、恶性肿瘤与其他肿瘤类型之间存在着紧密的联系。例如,肝癌与肝囊肿虽然同位于肝脏,但它们在纹理和恶性程度上存在差异;同样,肝癌与胰腺癌虽然在形态上相似,但却属于不同器官的恶性癌症。面对这一挑战,达摩院医疗AI团队引入了Transformer技术,创新性地提出了肿瘤表示学习方法,将肿瘤表示为Transformer中的语义Query,并为不同器官中的肿瘤及其子类型构建了语义层次结构,使模型的学习过程更为有效,提高了肿瘤及其子类型预测的一致性。这一模型实现了同时输出分割、检测和诊断结果的能力,从而有效解决了多癌多肿瘤识别的复杂任务。
在一项对631名患者的测试中,该模型在肿瘤检测、分割和诊断任务上的表现均优于单一器官模型的组合,其检测任务的平均敏感性达到了93%,平均特异性则为82%。
达摩院医疗AI团队的负责人吕乐博士指出,这项工作以统一模型的形式实现了“一次调用即诊断八种致命癌症”的目标,在保证模型简洁性的同时,维持了高敏感度。这一创新为放射科医生提供了强大的AI辅助诊断支持,特别是在癌症复发、远端转移等临床情况下,发挥了关键作用。
据悉,该模型的研究成果已被计算机视觉顶级会议ICCV 2023收录,并已在上海市第一人民医院等多家合作医院进行了应用测试。达摩院医疗AI团队专注于医学影像等领域的研究,致力于开发包括大规模筛查、精准诊断、预后治疗、响应评估在内的全癌症诊疗技术,覆盖多个重要病种。团队在新冠疫情期间研发的CT影像新冠肺炎AI辅助诊断系统曾被评为全国科技抗疫先进集体。
欲了解更多信息,请参阅论文链接: 论文链接