原发性肝癌(HCC)在中国的发病率和死亡率均位居前列,成为威胁民众健康的严重问题。随着对肝癌的研究不断深入,包括致病因素、早期诊断、基因组学、代谢组学、影像、病理、治疗、疗效评价、复发预测等多个方面的数据积累,机器学习的应用逐渐成为提升诊疗效率的关键技术。机器学习通过算法从大量数据中提取有价值的信息,进而优化诊断和治疗策略。
近年来,利用机器学习优化影像学检查成为了肝癌诊疗研究的热点。基于CT或MRI的肿瘤检测和分割技术在临床诊断中具有重要作用。传统的人工分割方法效率低下且主观性强,而基于先进计算技术的自动化分割方法越来越受到重视。
例如,Conze等人使用基于超体素的自适应随机森林技术,从动态增强CT扫描中分割肝癌病灶,并评估肿瘤坏死率。这种方法通过多阶段特征描述树叶超体素,使得随机森林能够自动推断信息最丰富的尺度,并通过临床数据进行了验证。
另一项研究中,Lu等人开发了一种基于深度学习的自动分割算法,能够自动检测和分割肝脏。该方法无需用户交互,定量结果显示,肝体积估计准确,且与手动分割方法具有高度相关性。
此外,Hu等人提出了一种基于3D深度CNN和全局优化表面演化的自动分割框架,能够实现复杂背景下的肝脏检测和分割。该方法在公共数据库和本地医院的CT图像上表现优异,精度高且高效。
Wang等人则开展了肝肿瘤诊断的深度学习研究,开发了一种“可解释”的深度学习系统,能够识别测试病灶中的正确影像特征,并提供诊断决策支持。该系统在多期MRI图像上对肝脏病变进行分类,结果显示其准确性、敏感度和特异性均较高,有望成为放射科医生决策的支持工具。
Pang等人研究了一种用于肝癌图像识别的凹凸变优化稀疏贡献特征选择和分类器,通过优化三种分类器(随机森林分类器、支持向量机分类器和极限学习机分类器),提高了肝癌图像分类的准确性。
临床医生在评价每例HCC患者的治疗时,需要考虑个体间的生物多样性。机器学习技术可以从临床数据中提取信息,辅助临床决策。然而,一些研究仍然存在局限性,如样本选择范围有限,未能充分考虑患者之间的异质性。
Santos等人通过构建包含不同临床特征的复杂HCC数据库,提出了新的基于聚类的过采样方法,提高了对小数据集和不平衡数据集的鲁棒性,能够解释HCC患者的异质性。研究表明,结合神经网络的方法在生活预测方面表现最佳。
Abajian等人利用机器学习技术,结合MRI和临床患者数据,建立了预测肝动脉化疗栓塞治疗反应的人工智能框架。该方法预测准确率较高,特别是对于临床变量和影像学变量的预测效果显著。
Tseng等人基于多时间序列数据处理算法,提高了肝癌复发预测的准确性。他们提出了一种新的周期合并算法,结合多测量支持向量机和多测量随机森林回归方法,结果显示多测量方法在预测性能上优于单次测量。
Divya等人则基于APO算法优化了肝癌复发预测的多时间序列临床数据集,提出了一种有效采样方法,克服了数据不平衡的问题,提高了分类的有效性和效率。
Chen等人设计了一种新的预测中期肝癌患者常规肝动脉化疗栓塞后预后的模型,结果显示该模型对预后的判断能力优于现有的分级系统。
Mai等人采用血白蛋白-胆红素评分(ALBI)结合谷草转氨酶-血小板比值(APRI)预测HBV相关性肝癌患者的肝切除术后肝功能衰竭(PHLF),结果显示ALBI评分结合APRI值在预测PHLF风险方面优于传统的Child-Pugh分级。
Liao等人采用机器学习方法鉴定含DEP结构域的蛋白质及其在人肝癌组织中的表达。通过计算方法构建了DEP DC的二元分类器,并通过实验验证了其在人肝癌组织中的表达情况。
中国医疗数据资源丰富,但与领先国家相比,在医疗数据的规范化、统一标准、多中心协同共享等方面仍存在一定差距。未来,随着计算机科学和深度学习技术的进步,机器学习在肝癌研究领域的应用将会更加广泛和深入,新的优秀算法将不断涌现,构建的模型也将更加精准和可靠,从而在HCC的诊疗中发挥更大的作用。