在固态材料化学领域,合成具有稳定晶体结构的新化合物是一项艰巨的任务。尽管已有大量的稳定晶体化合物数据记录,如ICSD数据库中超过20万条实例,但决定何种组合的元素能够形成稳定的晶体结构,是一个复杂且耗时的过程。这不仅涉及到动力学因素,还涉及到热力学因素,以及元素间化学键的多样性。因此,筛选潜在的合成对象成为化学家们的一大挑战。
为了克服这一挑战,来自利物浦大学的研究团队开发了一种基于无监督机器学习的创新方法。他们通过整合ICSD数据库中的相信息,定义了一系列包含合成孤立晶体化合物的可能性相场,以此作为元素组合选择的指南。与以往侧重于个体材料的研究不同,该团队构建了一个神经网络模型,专门用于对拟进一步研究的相场进行优先排序。这一排序依据的是相场与已知能促进材料稳定性形成的化学物质之间的相似性程度。
在构建模型的过程中,每种相场包含4个元素,每个元素都有37个化学属性(如原子质量、电荷、离子半径等),因此每个相场可以表示为一个148维的向量。由于数据维度高且非线性关系复杂,团队采用变分自动编码器(VAE)进行维度缩减,以量化高维空间内的非线性相似性。通过调整神经网络的权重和偏差,最小化重构误差,模型能够高效地识别出最有可能合成新化合物的相场。
基于机器学习模型的预测,研究团队首先聚焦于Li-Sn-S-Cl相场。通过晶体结构预测和盆地跳跃优化算法,他们探索了该相场内244种化合物的能量图景,最终锁定了Li3.3SnS3.3Cl0.7这一化合物。随后,通过Rietveld精修粉末同步加速器X射线衍射和中子粉末衍射技术,确认了Li3.3SnS3.3Cl0.7具有缺陷填充的纤锌矿结构。
最后,研究团队深入分析了锂离子在该化合物中的传导性和动力学性质,发现了三个可能的衍射通道,分别展现了不同维度的传导特性。通过比较这三个通道的单粒子势值,他们揭示了一维通道对于锂离子近液态传导最为有利。
通过结合无监督机器学习与传统实验方法,该研究不仅揭示了Li3.3SnS3.3Cl0.7这一新型化合物,还在锂离子传导机制上取得了重要进展。这一创新策略不仅加速了新材料的发现过程,也为未来固态材料化学的研究提供了新的思路和工具。