观点 | 在工程领域中,机器学习的数学理论基础尤为重要 ...
作者头像
  • 韶华杂谈
  • 2018-08-26 11:32:02 0

数学在机器学习中扮演着至关重要的角色,但通常我们只是借助数学工具来理解和分析具体算法的工作原理。近日,加州大学圣芭芭拉分校的Paul J. Atzberger探讨了机器学习中的经验风险与泛化误差边界的问题。他认为,在科学和工程领域,我们需要从基础理论和数学角度出发,有效地运用现有方法,或开发新方法来整合特定领域所需的知识。

近年来,越来越多的研究人员开始关注将机器学习应用于科学和工程问题。这主要得益于自然语言处理(NLP)和图像分类(IC)领域的最新进展。然而,科学和工程问题具有独特的特性和需求,这给机器学习方法的设计和部署带来了新的挑战。因此,对机器学习方法的数学基础及其进一步发展提出了更高的要求,以提高方法的严谨性,并确保结果的可靠性和可解释性。正如“没有免费的午餐”定理所表明的,成功的关键在于结合适当的归纳偏置和领域知识。因此,即使是已被广泛应用的方法,也需要更多的数学研究,以更好地将科学知识和相关归纳偏置融入学习框架和算法中。

在构建机器学习方法的理论之前,有必要简要介绍机器学习方法开发和部署的各种模式。监督学习的核心在于,在条件不完美的情况下,找到输入数据x与输出数据y之间的函数关系f,即y=f(x)+ξ,这里的不完美条件包括数据有限、噪声ξ不为零、维度空间过大或其他不确定因素。此外,还有无监督学习、半监督学习和强化学习等其他模式。本文主要关注监督学习,但类似的问题也存在于其他模式中。

值得注意的是,许多机器学习算法的成功,如NLP和IC,很大程度上依赖于合理利用与数据信号特征相关的先验知识。例如,在NLP中,Word2Vec通过预训练步骤获取词嵌入表示,这些表示能够编码语义相似性;而在IC中,卷积神经网络(CNN)通过在不同位置共享卷积核权重,整合自然图像的先验知识,从而获得平移不变性这一重要属性。这种先验知识的整合还包括对数据信号内在层次结构和构造本质的理解,这推动了深层架构的发展,使得这些架构能够高效捕捉相关信息。

在科学和工程领域,同样需要这样的思考来获取对领域的深刻理解。我们需要调整和利用机器学习算法,以便更有效地应用这些算法。本文简要介绍了监督学习的概念。与传统的逼近理论不同,监督学习不仅是为了根据已知数据逼近最优解f,还要考虑不确定性,以确保模型在未见过的数据上也能表现出良好的泛化性能。这可以通过最小化损失函数L来实现,其中L的期望定义了真实风险R。然而,由于模型从数据中获得的关于分布D的信息有限,R在实践中难以计算,因此我们通常使用替代误差,如经验风险。虽然经验风险的使用在统计学上有一定的成本,但在实践中却非常有用。

我们可以了解到,通过谨慎选择假设空间H和复杂度c(f),可以实现更好的泛化和更优的性能。在科学和工程应用中,这可能包括通过设计c(f)或限制H来整合先验信息。例如,限制H仅保持符合物理对称性的函数,满足不可压缩等限制,或满足守恒定律。这可以更好地对齐c(f)和经验风险R,从而确保较小的真实风险R。尽管传统上这是机器学习的重点,但这并不是唯一的策略。

正如深度学习方法所展示的,我们可以使用复杂的假设空间,但不必依赖于随机梯度下降等训练方法,而是支持较低复杂度的模型,只保留与预测Y相关的输入信号X。在科学和工程应用中,由于可以获得大量关于输入信号的相关先验知识,类似的机会也存在。例如,作为限制假设空间的一种替代方法,可以在训练过程中对输入数据进行随机旋转,以确保模型在对称情况下仍能保持预测结果不变。此外,还可以利用对输入数据和最终目标的洞察来结合这些方法。

我们看到,即使是在泛化边界方面,也可以获取大量新的见解。进一步的数学研究,以改进边界和训练方法,可能对高效使用现有方法或开发新方法来整合先验知识大有裨益。我们希望本文可以作为数学研究的一个起点,开发出更多框架和方法,更好地适应科学和工程应用。

    本文来源:图灵汇
责任编辑: : 韶华杂谈
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
尤为观点机器领域理论重要数学基础工程学习
    下一篇