研究人员发现,利用大量化学安全性数据训练的机器学习软件在预测某种毒性方面表现出色,其准确性甚至可以与昂贵的动物研究结果相媲美,有时甚至更为精准。
约翰霍普金斯大学的毒理学家托马斯·哈东指出,计算机模型可以替代一些常规的安全性研究,例如将化合物滴入兔子眼睛以检查刺激性,或将化学物质喂给老鼠以确定其致死剂量。大数据的应用使得我们能够创造出比许多动物实验更具预测性的工具。
近日,哈东的研究团队在《毒理学科学》杂志上发表了一篇论文,报告了他们的算法能够准确预测数千种化学物质的毒性,涵盖范围广泛,包括吸入损伤、对水生生态系统的危害等多种测试类型。这篇论文强调了大数据在毒理学中的应用前景,德国路德维希港的巴斯夫毒理学家本纳德·范·拉文斯瓦伊指出,这种方法将成为未来毒理学的重要支柱。
尽管如此,评估复杂危害如致癌性或生殖干扰时,动物实验仍难以被完全取代。数十年来,工业界和学术界一直在使用计算机模型来预测毒性,这些模型通常会考虑分子结构及其体内反应,以及动物试验或体外研究的数据。然而,监管机构对这些方法设置了较高的标准,往往要求进行动物研究。
为了提升软件的性能,哈东的团队创建了一个庞大的数据库,包含约10000种化学物质的信息,基于大约80万个动物测试数据。这些数据最初由欧洲化学品管理局(ECHA)收集,作为2007年实施的REACH法规的一部分,要求公司在欧洲销售的化学品提供安全信息。
ECHA公开了这些数据,但并未以机器可读的格式呈现。因此,2014年哈东的团队将数据提取到一个机器可读的数据库中,这引发了与ECHA之间的法律争议。最终,哈东同意不发布自己的数据库,而ECHA也在一个单独的公共文件中公布了部分关键研究成果。
使用读取法,哈东的软件将新化学物质与相关化合物进行对比,并通过参考已知化学物质的特性来评估潜在的毒性效应。哈东表示,该软件实际上是在自动化地模拟毒理学家的工作流程。此外,该数据库分析揭示了动物实验中的不一致性,即对同一化学物质的重复试验可能得出不同结果,因为并非所有动物的反应都相同。
其他研究人员和公司也在开发类似的机器学习算法,尽管尚未发表相关论文。化学品安全机构对此保持高度关注。例如,替代方法验证机构间协调委员会代表美国16个政府机构开发了替代动物安全测试的方法,并邀请多个学术和商业研究团队参与。这些团队使用各自的软件来预测40000种化学物质的“致死剂量”毒性。
结合最佳软件(包括哈东的软件)产生的共识计算模型,被认为与动物实验的结果相当。今年晚些时候,美国环保署(EPA)计划在线发布该共识模型供免费下载。在美国,2016年的立法赋予EPA推广非动物试验方法的权力,以确保化学品在上市前的安全性。上个月,EPA发布了一份战略计划,旨在推广包括软件在内的无动物测试方法。
在欧盟,ECHA也鼓励公司通过使用读取法和基于实验室细胞分析的方法来避免动物试验。尽管取得了进展,但科学界仍需进一步研究,以完善计算机在毒理学预测中的应用。正如Rasenberg所言:“没有人希望使用动物测试,但我们还不能完全依赖计算机来做所有的毒理学预测。”