据媒体报道,抗体不仅由人体免疫细胞产生,用以对抗体内的病毒和其他病原体,还被广泛应用于医疗领域。这是因为抗体具有高度特异性,能够依据“锁钥原理”精准识别并结合特定分子。它们的应用范围涵盖肿瘤学、自身免疫性疾病以及神经退行性疾病的治疗。
然而,开发这些抗体药物并非易事。首先,抗体必须以最佳状态与目标分子结合,同时还需要满足一系列附加条件,如避免引起免疫反应、有效生产并保持长时间稳定。
科学家们在确定了与目标分子结构相匹配的抗体后,仍需进行一系列优化工作。由苏黎世联邦理工学院(ETH)生物系统科学与工程系教授Sai Reddy领导的研究团队,已经开发出一种机器学习方法,旨在提升抗体药物的效能。
传统的优化过程中,研究者通常从数千个候选抗体中筛选出最合适的几种,通过自动化流程在实验室中进行测试。然而,这种方法存在局限性,难以处理更多数量的样本。
为了扩大候选抗体的规模,Reddy和他的团队采用了机器学习技术。通过这种方法,他们将初始抗体库扩展到了数百万个候选抗体。Reddy表示,候选药物数量的增加,意味着找到完全符合药物开发所有标准的可能性更大。
研究人员以赫赛汀这一已被广泛应用的抗体抗癌药物为例,验证了他们新方法的有效性。赫赛汀是一种已上市20年的药物,虽然它在科学界广为人知且其结构数据公开,但研究团队并未试图对其现有版本进行改进,而是利用其结构特征作为基础,开发新的抗体变体。
从赫赛汀的DNA序列出发,ETH的研究人员利用CRISPR渐变技术生成了约4万个相关抗体,并通过实验确认其中1万个抗体能够较好地与目标蛋白质结合。接下来,他们使用这4万个抗体的DNA序列训练了一种机器学习算法,该算法随后在包含7000万个潜在抗体DNA序列的数据库中进行了搜索,预测了这些抗体与目标蛋白质结合的能力,并最终筛选出数百万个可能的候选序列。
利用进一步的计算机模拟,研究者评估了这些候选序列是否满足药物开发所需的额外标准,如耐受性、生产可行性和物理特性等,从而将候选序列缩减至8000个。
研究团队从计算机优化后的序列中选择了55个进行实验室生产,并测试其特性。实验结果显示,一些序列与目标蛋白质的结合效果甚至优于赫赛汀,且在生产效率和稳定性方面也有所提升。Reddy指出,某些新变体甚至可能比赫赛汀更具耐受性,后者有时会引起轻微的免疫反应,但这一问题在大多数情况下并不严重。不过,对于许多其他抗体来说,这一点仍然是需要特别注意的问题。
目前,ETH的研究人员正利用人工智能技术优化处于临床开发阶段的抗体药物。为此,他们成立了一家名为deepCDR Biologics的衍生公司,与早期及成熟期的生物技术和制药公司合作,共同推进抗体药物的研发进程。