150页「几何深度学习」上线:用对称性和不变性处理机器学习成绩
作者头像
  • 当科技
  • 2021-04-30 11:55:41 5

近年来,深度学习领域取得了显著进展,特别是在解决高维学习任务方面,如计算机视觉和蛋白质折叠等。尽管高维空间的学习任务复杂度较高,但许多任务可以通过深度学习方法实现。这得益于一些特定的深度学习模型,如卷积神经网络(CNN)、图神经网络(GNN)、长短时记忆网络(LSTM)和变换器(Transformer)等。

《几何深度学习》这本书探讨了这些模型之间的共通之处,并通过几何一致性的角度揭示了其中的规律。该书介绍了如何利用对称性和不变性的原理,构建有效的神经网络架构。这些原理不仅构成了卷积神经网络和图神经网络的成功基础,还为开发新的神经网络架构提供了理论支持。

该书由Michael M. Bronstein、Joan Bruna、Taco Cohen和Petar Veličković合著,他们分别来自帝国理工学院、纽约大学和DeepMind等研究机构。书中详细介绍了如何从对称性和不变性的角度提炼出构建常用神经架构所需的知识,包括CNN、GNN、Transformer和LSTM等模型。此外,书中还涵盖了一些新模型,如球面卷积神经网络(Spherical CNN)、SO(3)-Transformer和规范等变网格CNN等。

全书分为七章,涵盖了从高维空间学习到几何先验知识,再到几何域和几何深度学习模型等内容。为了帮助读者更好地理解这些概念,作者之一Petar Veličković建议读者在阅读本书之前,可以先观看他和其他作者的相关视频分享。这些视频内容可以帮助读者更好地理解书中的一些抽象概念。

书中还介绍了一些关键概念,如域、对称群等。域是指数据的所有“点”的集合,例如图像中的所有像素或图中的所有节点和边。对称群则是指集合Ω到Ω本身的双射集合,即通过某种变换不会改变对象的集合。这些概念对于理解神经网络的对称性和不变性非常重要。

总之,《几何深度学习》这本书通过几何一致性的视角,揭示了构建有效神经网络架构所需的数学原理和方法。对于希望深入了解这一领域的读者来说,这本书是一个很好的资源。

    本文来源:图灵汇
责任编辑: : 当科技
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
对称性学习变性几何深度上线机器成绩处理150
    下一篇