机器学习和深度学习数学基础::向量和矩阵的来源?
作者头像
  • 中国音乐财经网
  • 2020-05-12 11:43:42 2

文章重点

在线性代数中,理解和掌握向量和矩阵的概念非常重要。很多人常常会问,向量和矩阵与深度学习有何关联。简而言之,神经网络的输入是向量,通过矩阵进行线性变换,经过反复计算,最终实现损失函数最小化,从而优化模型。因此,理解向量和矩阵对于掌握深度学习至关重要。

为什么需要向量和矩阵?

我们在初中就开始接触向量,但为什么要用向量呢?当我们处理简单的数学问题时,输入和输出通常都是单个实数。然而,在某些情况下,输入可能是多个数值,输出也是多个数值。这时就需要用到向量来表达这些数值。向量可以被看作是有大小和方向的线段,它可以是高维的,尽管我们难以直观想象高维空间,但向量在属于它的高维空间中始终是一条直线。因此,输入一个向量到函数中,输出也是一个向量,而这个函数就是矩阵。

如何理解向量

现在我们已经知道向量是一种直线。为了便于可视化,我们可以用一个二维向量作为例子,例如(1,2)。如果我们把它画出来,它看起来是这样的:

(图略)

这种表示方法是基于默认的坐标系,即二维空间的基向量为i(1,0)和j(0,1)。因此,向量(1,2)可以用基向量表示为1i+2j。

补充说明:之所以选择i(1,0)和j(0,1)作为二维空间的基向量,是因为在这种基下,线性空间中的所有向量都能方便地转换,这种基被称为“自然基”。

如何理解矩阵是函数

我们之前接触的函数通常是简单的形式,如y=kx+b,例如y=2x+7,当输入x=1时,计算过程为2*1+7=9。这种函数的计算方式非常直观。而在线性代数中,矩阵也是一种函数。那么,我们应该如何理解这种函数呢?

(图略)

如上所示,我们用一个矩阵和一个向量相乘,得到一个新的向量。具体来说,矩阵的每一行与向量相乘,从而得到一个新向量。

(图略)

我们知道(1,2)=1.i+2.j,其中基向量i(1,0)和j(0,1)。

那么矩阵乘以向量(1,2)时,相当于把基向量i替换成矩阵的第一列(0,-1),基向量j替换成矩阵的第二列(1,0)。这意味着基向量变成了i(0,-1)和j(1,0)。此时,向量(1,2)在新的基向量基础上变为1i+2j=(2,-1)。可以看到,(2,-1)就是最终的计算结果,这就是矩阵的函数作用。

总结来说,矩阵的函数作用就是将一个向量从原来的基坐标表示转换为新的基坐标表示,而这个新的基就是矩阵的每一列。后面我们还会看到,这种函数也可以称为线性变换,即将一个向量映射为另一个向量,每个线性变换都有对应的矩阵。

总结

本文大致介绍了向量和矩阵的基本概念。如果你还不了解线性空间和基的概念,没关系,后续的文章将会详细介绍这些内容。

    本文来源:图灵汇
责任编辑: : 中国音乐财经网
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
学习数学基础向量矩阵深度机器来源
    下一篇