化学元素构成了我们物理世界的绝大部分。截至2016年,人类已经确认了118种元素,所有这些元素都可以在元素周期表中找到,这张表格通常悬挂在每一个化学实验室和教室里。
元素周期表上的每个元素都有一个一到两个字母的符号,比如“O”代表氧气,“Al”代表铝。此外,周期表还会标明每个元素的原子序数,即原子核中的质子数量。质子的数量非常重要,因为它决定了电子围绕原子核运行的数量,从而定义了元素的本质及其化学性质。简而言之,原子序数是元素的身份标识。
最近,《自然·化学》杂志发表了一篇论文,来自瑞士洛桑联邦理工学院(EPFL)基础科学学院的化学工程师们通过对元素周期表的深入研究,发现了一个关键数字——元素的氧化态,也称为氧化数。氧化态描述了原子为了与其他原子形成化学键而需要获得或失去的电子数量。
领导这项研究的Berend Smit教授指出:“在化学中,氧化态总是在化合物的化学名称中被提及。氧化态在化学基础中扮演着至关重要的角色,以至于有人认为它应该被视为周期表的第三维度。例如,铬在氧化态III时对人体是必需的,而在氧化态IV时则具有极高的毒性。”
当涉及单一元素时,确定其氧化态相对直接,但当涉及到由多种元素组成的化合物时,情况就变得复杂起来。Smit教授表示:“对于复杂的材料,实际上无法从基本原理预测氧化态。大多数量子程序都需要金属的氧化形式作为输入参数。”
目前预测氧化态的最佳方法仍然是基于20世纪初发展起来的“键价理论”,它根据组成元素原子间的距离来估算化合物的氧化态。然而,这种方法并不总是有效,尤其是在具有晶体结构的材料中。Smit指出:“众所周知,除了距离之外,金属配合物的几何形状也很重要。然而,考虑到这一点的努力尚未取得成功。”
在这项研究中,研究人员训练了一种机器学习算法,将一组著名的材料——金属有机框架按其氧化态进行分类。研究团队利用了剑桥结构数据库(一个晶体结构库),其中包含了材料名称中的氧化态信息。Smit表示:“该数据库非常混乱,存在许多错误。实验、专家猜测和不同版本的键价理论都被用来分配氧化态。我们假设化学领域具有自我纠正机制,因此尽管个别数据可能出错,但整个社区最终会达成一致。”
EPFL的Smit团队的一名博士生Kevin Jablonka解释道:“我们创建了一个机器学习模型,它捕捉到了化学界的集体智慧。我们的机器学习模型就像电视游戏节目《谁想成为百万富翁》中的求助热线,如果化学家不知道氧化态,他们可以通过求助现场观众来获得答案。通过上传晶体结构和我们的机器学习模型,我们就能得到最有可能的氧化态。”