机器学习(Machine Learning)不仅是人工智能研究的核心领域,也是整个计算机科学中最具活力和发展潜力的分支之一。近年来,欧美各国纷纷加大了对机器学习的研究和应用投入,下面我们将探讨一些通过机器学习实现的重要科研进展。
美国研究人员开发了一种多功能的机器学习框架,旨在帮助寻找新材料。在东南大学Christopher Wolverton的带领下,研究团队使用已知材料的数据训练机器学习技术,建立了预测新材料特定属性的模型。通过研究光伏应用中的新型结晶化合物和基于具有形成玻璃可能性的三元合金金属玻璃,证明了该技术的可行性。研究指出,优化机器学习算法和细分输入数据可以提升特定参数的预测精度。这项技术有望帮助研究人员利用大型材料数据库,从而加速新材料的搜索过程。
机器学习技术可以预测锆的相变。美国洛斯阿拉莫斯国家实验室的Turab Lookman等人使用高斯型机器学习方法预测锆中相变的原子间势能。通过局部原子环境变化来表示每种原子的能量贡献,如键长、形状和体积。这种方法成功描绘了纯锆的物理特性,并在分子动力学模拟中预测了锆相图,该图是温度和压力的函数,与之前的实验和模拟结果一致。这项研究展示了在相变系统中开发学习的原子间势的重要性。
电子显微镜和缺陷分析是材料科学的基础,因为它们提供了材料微观结构和性能的详细信息。如果能够建立一个强大的自动缺陷识别和分类平台,可以在图像采集过程中或记录图像后更快地完成分析。然而,需要大量的图像来提取统计显著的信息,目前这一过程仍需人工完成,不仅耗时,还容易出现不一致的情况。美国威斯康星大学麦迪逊分校的Dane Morgan等人和橡树岭国家实验室的团队结合机器学习、计算机视觉和图像分析技术,获取了关于缺陷尺寸和类型的详细信息。目前该程序的性能与人工分析一致,未来可以进一步改进以实现实时分析大数据集。
为了设计高效的有机光伏(OPV)材料,必须确定控制其属性的最大数量的参数,并利用这些参数建立模型,以预测功率转换效率(PCE)。南京大学的马海波和英国利物浦大学的Alessandro Troisi等研究人员通过构建280个小分子OPV系统的数据集,发现供体分子的前线分子轨道几乎退化。在这种情况下,这些轨道参与激子形成、激子解离和空穴传输过程,从而影响OPV的宏观性质。通过使用机器学习方法,基于13个重要微观特性建立预测PCE的模型。研究表明,该模型可用于高通量虚拟筛选潜在的新供体分子,从而应用于高效的OPV。
机器学习方法已被广泛应用于现代技术中,包括自动控制、内容推荐、高频交易等。瑞士巴塞尔大学的O. Anatole von Lilienfeld教授提出,机器学习可以推断出近似解,通过插入之前获得的分子和材料属性数据集,而非在数值上求解计算要求的量子或统计力学方程。该研究适用于量子机器学习,是一种归纳性分子建模方法,适用于解决量子化学问题。
金属玻璃(BMG)因其独特的物理特性而被广泛应用。然而,设计这些材料的瓶颈在于缺乏可预测的工具来分析合金成分与理想功能之间的关系。美国东南大学的Chris Wolverton等研究人员开发了一种机器学习模型,用于设计金属玻璃,该模型可以预测BMG组合物的三个关键特性:非晶态存在的能力、临界铸造直径和过冷液体范围。该模型仅使用合金成分作为输入,基于8000多个金属玻璃实验数据集构建而成。通过这些ML模型,研究人员优化了现有商业合金的功能,并发现几种ML预测组合物能够在设计变量中形成玻璃,并超过现有合金。
机器学习在新材料发现和设计中发挥着重要作用。德国弗劳恩霍夫材料力学研究所的Johannes J. Möller等研究人员展示了机器学习在材料研究中的潜力,通过构建基于内核的机器学习模型,预测新永磁体的最佳化学成分。这些模型通过基于密度泛函理论的高通量筛选获得的磁性数据进行训练和测试。通过选择不同的配置,并使用机器学习模型进行成分优化,成功预测了具有相似内在硬磁特性但数量较少的稀土元素替代品。
美国洛斯阿拉莫斯国家实验室的Turab Lookman、美国凯斯西储大学的Alp Sehirlioglu和美国弗吉尼亚大学的Prasanna V. Balachandran等研究人员展示了一种两步机器学习方法,以指导实验寻找具有高居里温度的xBi[Me'yMe''(1-y)]O3-(1-x)PbTiO3基钙钛矿。通过分类学习来选择钙钛矿结构中的成分,并结合回归与自动学习以识别潜在的钙钛矿。这种方法通过自动学习成功和失败的实验结果,循环迭代地改进机器学习模型。最终,该方法在合成的十种组合物中发现六种钙钛矿,包括三种先前未开发的{Me'Me''}对,其中0.2Bi(Fe0.12Co0.88)O3-0.8PbTiO3显示出最高测量的居里温度达898K。
美国马里兰大学的Valentin Stanev等研究人员,包括来自杜克大学和NIST的科学家,开发了多种机器学习方案,用于模拟超过12,000种已知超导体和候选材料的临界温度(Tc)。他们首先仅根据化学成分训练分类模型,根据其Tc是高于还是低于10 K对已知超导体进行分类。然后,他们开发了回归模型来预测各种化合物的Tc值。通过包含AFLOW在线存储库中的数据,可以进一步提高这些模型的准确性。最终,他们将分类和回归模型组合成一个单一的集成管道,以搜索整个无机晶体结构数据库,并预测超过30个新的候选超导体。
自由电子激光器提供的超短高亮度X射线脉冲在科学研究中具有巨大潜力,是揭示物质结构动态的关键因素。为了充分利用这一潜力,必须准确了解X射线特性:强度、光谱和时间分布。虽然存在一些诊断工具,但它们通常是破坏性的,且许多无法以高重复率操作。英国帝国理工学院的A. Sanchez-Gonzalez和J. P. Marangos等研究人员提出了一种绕过这种限制的技术。他们采用了机器学习策略,通过在一组完全诊断的脉冲上训练模型,仅使用易于以高重复率记录的参数来准确预测每次射击的X射线属性。这种方法为实现下一代高重复率X射线激光器打开了大门。
以上科研成果主要由易智编译整理,希望对相关领域的科研人员有所帮助。