微分方程与机器学习作为AI范畴建模的两种方法,各自具备哪些独特的优势?
微分方程(DE)与机器学习(ML)这两种方法都能够推动AI领域的发展。它们之间有何不同?本文将进行对比分析。
微分方程模型示例
纳维-斯托克斯方程(气候学) 这一模型用于天气预测,是一个混沌模型。即便输入有轻微偏差,预测结果也会显著不同。因此,天气预报经常会有误差,天气模拟需要借助超级计算机完成。
爱因斯坦场方程(物理学) 爱因斯坦场方程描述了引力定律,是广义相对论的数学基础。
Black-Scholes模型(金融) Black-Scholes模型用于股票市场中金融衍生品的定价。
SIR模型(流行病学) SIR模型是一种基础的房室模型,可以描述传染病的传播情况。
为什么这四个方程都是微分方程?因为它们都包含某些未知函数的导数(即变化率)。这些未知函数(如SIR模型中的S(t)、I(t)和R(t))被称为微分方程的解。
Murray-Gottman模型(心理学) 该模型用于预测浪漫关系的稳定性。心理学家John Gottman的研究表明,持续的消极氛围是预测婚姻成功的重要指标。
请注意,Murray-Gottman“爱情模型”实际上是一个差分方程,它处理的是离散的数字序列(例如每5年的人口普查数据),而微分方程则适用于连续数值(即持续发生的事情)。
上述五个模型(包括微分方程和差分方程)都是机械模型,可以通过设定系统的逻辑、规则、结构或机制来进行实验。当然,并非每次实验都会成功,反复实验在数学建模中非常重要。
纳维-斯托克斯方程假设大气是一个流动的流体,该方程来自流体力学。广义相对论假设在特定几何形状下,时空会发生扭曲。爱因斯坦提出了关于时空扭曲的一些关键思想,数学家Emmy Noether和David Hilbert将这些思想整合到了爱因斯坦场方程中。SIR模型假设病毒通过感染者与未感染者之间的直接接触传播,并且感染者会以固定速率自动恢复。
在使用机械模型时,观察和直觉会指导模型设计,而数据则用于验证假设。
相比之下,经验或数据驱动模型首先从数据出发。其中包括机器学习模型,其算法通过输入大量高质量样本来学习系统的基础逻辑或规则。当人类难以分析或定义系统的机制时,这种方法非常有效。
数学模型的分类
机械模型对驱动系统的底层机制进行了假设,在物理学中广泛应用。实际上,数学建模始于17世纪人们试图解开行星运动规律之时。
经验或数据驱动建模,尤其是机器学习,可以让数据来学习系统的结构,这个过程称为“拟合”。机器学习对于人类难以将信号从噪声中分离出来的复杂系统尤其有效,只需要训练一种智能算法,让它替你完成繁琐的任务。
机器学习任务大致可分为: - 监督学习(回归与分类) - 无监督学习(聚类和降维) - 强化学习
如今,机器学习和人工智能系统已广泛应用于日常生活。从语音助手到推荐引擎,再到人脸识别技术和自动驾驶技术,这些都由嵌入大量代码中的数学与统计模型驱动。
我们可以进一步将机械模型和经验模型分为确定性模型(预测是固定的)和随机性模型(预测包含随机性)。
确定性模型忽略随机变化,在相同的初始条件下,总能预测出相同的结果。 随机模型考虑了随机变化,如系统中个体的异质性,例如人、动物、细胞之间的细微差异。
随机性通常会在模型中引入一些理想化因素,但也带来一定代价。在数学建模中,我们需要权衡模型的复杂性:简单的模型易于分析,但可能缺乏预测能力;复杂的模型更具现实性,但要弄清模型背后的原理也更加重要。正如统计学家George Box所说:“所有的模型都是错误的,但其中一些是有用的。”
在机器学习和统计学中,模型复杂度被称为“偏差-方差权衡”。高偏差模型过于简单,导致欠拟合;高方差模型则容易捕捉噪声而非信号(即系统的实际结构),从而导致过拟合。
微分方程与机器学习示例对比
Logistic微分方程 该方程涉及农业、生物学、经济学、生态学、流行病学等领域。
绘制dP/dt对t的曲线:
Logistic模型的一个例子是Hubbert峰值石油模型。1956年,石油地质学家Marion Hubbert为德克萨斯州的石油产量创建了一个预测数学模型。
令P表示德克萨斯州的产油量。如果左边是rP,则石油产量将会成倍增长。但Hubbert知道油量总共只有K=200亿桶。随着时间的推移,开采石油变得越来越困难,因此生产率dP/dt有所下降。(1-P/K)项反映了资源有限的观察结果。注意,在考虑实际数据之前,我们已经推断出石油开采的机制。
代表生产率的参数r=0.079是从50年的数据中推断出来的。 代表石油总量的参数K=200,这是系统的波动形状。
机器学习模型很难学习嵌入到微分方程中的逻辑所捕捉的潜在机制。从本质上讲,任何算法都需要仅基于1956年之前的数据(绿色)来预测最大值。
为了完整性,本文作者训练了一些多项式回归、随机森林、梯度提升树。注意只有多项式回归会外推超出原始数据范围。
随机森林
多项式回归
多项式回归可以很好地捕捉信号,但这种二次函数(图像为抛物线)在1970年后达到石油峰值后,无法再次下降。红色曲线只会越来越高,表示采油量接近无限大。
Hubbert的机械模型解决了这一建模难题。
当人类难以捕捉和定义系统的规则和机制时,机器学习方法表现出色。也就是说,从噪声中提取信号的方法超出了人类的努力范围,更好的方法是让机器通过使用高质量示例来学习规则和信号,这就是用数据训练机器。数据质量越高,结果就越好。神经网络作为学术和应用机器学习领域的先锋,能够捕捉到惊人的复杂性。
求解Logistic微分方程,并绘制P(t)和P'(t)
本文介绍了Logistic微分方程,并立即绘制了其解P(t)及其导数dP/dt。这里省略了一些步骤,具体操作如下。
方法1:数值模拟 首先将微分方程编程到Python或Matlab中,在将dP/dt绘制为t的函数之前,使用数值求解器获得P(t)。此处使用Python。
方法2:获取解析解 该系统可以通过分离变量法求得解析解。请注意:大多数微分方程无法求得解析解。对此,数学家一直在寻找求解析解的方法。以新西兰科学家Roy Kerr为例,他发现了爱因斯坦场方程的一组精确解,从而揭示了黑洞的存在。幸运的是,Logistic微分方程中有一些是可以求得解析解的。
首先将所有含P的项移到等式左边,含t的项移到右边:
将二者整合到一起可得到通解,即满足微分方程的一组无限多个函数。
微分方程总是有无限多个解,由一系列曲线以图像形式给出。
将P重新排列,得到:
微分得到:
这两个公式对应上述Logistic曲线和类高斯曲线。
总结
在机械建模中,研究者会仔细观察并研究现象,然后用数据验证模型,验证假设是否正确。如果假设正确,自然很好;如果错误,也没关系,建模本身就是要反复试验的,可以选择修正假设或重新开始。
在数据驱动建模中,我们让数据来构建系统的蓝图。人类要做的是为机器提供高质量、有代表性和足够多的数据。这就是机器学习。在人类难以观察到现象的本质时,机器学习算法可以从噪声中提取信号。神经网络和强化学习是当前热门的研究领域,它们能够创建具有惊人复杂性的模型。AI革命仍在继续。