在当今的大数据时代,人工智能(AI)已成为科研人员的重要帮手。例如,机器学习算法正在帮助生物学家理解控制基因功能的大量分子信号。然而,随着新型算法的出现,它们变得越来越复杂且难以解读。
最近,美国普林斯顿大学的定量生物学家Justin B. Kinney和Ammar Tareen提出了一种设计高级机器学习算法的新策略,使得这些算法更加易于生物学家理解和应用。他们的研究成果在12月13日举行的首届计算生物学机器学习会议上发布。
他们所开发的新算法属于人工神经网络(ANN)的一种。ANN是一种基于大脑中神经元连接模式启发的高级机器学习计算基础,尽管其名称可能让人误以为它主要用于研究大脑。大规模并行报告基因检测(MPRA)是一种用于研究DNA的方法,生物学家常用ANN分析由MPRA产生的数据。利用这些数据,定量生物学家能够创建预测哪些分子在基因调控过程中控制特定基因的ANN。
细胞并不总是需要所有蛋白质,而是依赖复杂的分子机制来根据需求开启或关闭产生蛋白质的基因。当这些机制失灵时,通常会导致混乱和疾病。Kinney表示,理解基因调控的工作原理对于开发针对疾病的分子疗法至关重要。然而,传统的ANN在处理MPRA数据时往往难以与生物学家提出的科学问题相匹配,这导致生物学家难以解释基因调控过程。
Kinney和Tareen开发的新方法旨在弥合计算工具与生物学家思维方式之间的差距。他们设计了定制的神经网络,从数学角度反映了生物学中基因及其调控分子的独特概念。这种方法本质上是促使机器学习算法以生物学家易于理解的方式来处理数据。
Kinney指出:“我们优化了现代工业中的人工智能技术,使其更适合应用于生命科学研究。”在验证了这一新策略之后,Kinney的实验室正将其应用于多个生物系统的研究,包括与人类疾病相关的关键基因通路。
论文预印本可在以下链接查阅:https://www.biorxiv.org/content/10.1101/835942v1.full
编译:花花 审稿:三水 责编:张梦
原文链接:https://www.cshl.edu/finally-machine-learning-interprets-gene-regulation-clearly/
请注意,以上内容是对原文的改写,保留了原文的核心信息和价值点,但进行了适当的调整和优化。