从现在开始,我们将介绍线性代数中最重要的部分——线性空间和线性变换。
我们经常提到生活在三维空间中,这是一个我们非常熟悉的空间。那么这个空间具有哪些特性呢?
不论何种空间,都必须支持其内部按照规则发生的运动(即变换)。每种空间通常会有一种相应的变换形式。例如,在拓扑空间中存在拓扑变换,在线性空间中存在线性变换,在仿射空间中存在仿射变换。
拓扑变换指的是在拓扑空间内从一个点到另一个点的跳跃。再如,仿射变换是指在仿射空间内从一个点到另一个点的移动。而线性变换则是指在线性空间V中的某一点移动到另一个线性空间W中的另一点的过程。这意味着线性变换不仅可以在同一空间内移动点,还可以将点移动到另一个空间中,只要变换前后的对象都是线性空间中的元素,这种变换就是线性变换。
“空间”是一个包容运动的对象集合,而变换则规范了对应空间的运动。本篇文章将重点讨论线性空间中的线性变换(运动)。
在线性代数中,有两个基础概念是向量和矩阵。
在线性空间中,我们可以通过选取基和坐标的方式将对象表示为向量的形式。通过向量可以描述空间中的对象。在线性空间中,对象是可以运动(变换)的,我们可以用矩阵来表示这一运动。通过矩阵乘以向量,可以使对象产生相应的运动。因此,可以用一句话概括:在线性空间中选定基后,向量描述对象,矩阵描述对象的运动(每个变换都有对应的矩阵),利用矩阵与向量的乘法施加运动。在后续内容中,我们会看到矩阵的范数、行列式等概念都可以视为这一运动的属性。
矩阵是线性空间中线性变换的一种描述。在线性空间中,一旦选定一组基,任何线性变换都可以用一个确定的矩阵来描述。选定一组基后,每一个线性变换都可以找到一个对应的矩阵。更换基后,会得到一个不同的矩阵。所有这些矩阵都是同一个线性变换的不同表现形式,但不是线性变换本身。
也就是说,同一个线性变换在不同基下可能对应多个矩阵,但这些矩阵都表示同一个线性变换,这些矩阵之间存在相似关系。用数学语言表示就是:
[中心对齐] 矩阵相似的定义 [/中心对齐]
因此,A和B是相似矩阵。从这个角度看,相似矩阵就是同一个线性变换在不同基下的不同矩阵。而矩阵P表示的是矩阵A对应的基和矩阵B对应的基之间的转换关系。
矩阵在线性代数中相当于函数,它可以描述一个变换,将线性空间中的某个对象从一个点移动到另一个点。它的核心功能是将原来点的基转换成另一个基。也就是说,原来的点在一个基下表示,变换后的点在另一个新基下表示。那么这个新基是什么呢?
举例说明:
假设有一个向量对象(1,2),这个向量对象在线性空间中用基i(1,0), j(0,1)表示,那么在这个基下,它表示为(1,2)。如果我们对这个对象进行线性变换,该变换用矩阵|0 1 -1 0|表示,变换后的结果为(2,-1)。从另一个角度看,原始基为i(1,0), j(0,1),经过变换后,可以认为基变为i(0,1), j(-1,0)。因此,在这个新基下,原始向量(1,2)表示为2i-1j=(2,-1),这就是矩阵改变基的表现,也是矩阵运算的本质。
[中心对齐] 矩阵相似的定义 [/中心对齐]
是否可以说同一个向量在不同基下有不同的表示呢?向量客观存在,但要将其表示出来,需要将其置于一个坐标系中进行度量。你选择的坐标系(基)不同,向量的表示也会不同。因此,我们现在感觉(1,2)和(2,-1)可能是同一个对象,这并非错觉,而是事实,它们是不同基下的表示。
由此得出结论,变换是通过矩阵完成的,矩阵描述了运动。这个运动是通过改变原始向量的坐标系来实现的,或者说这个运动是对坐标系施加的,从而将原始坐标系转换到一个新的坐标系。新的坐标系是通过原始坐标系的矩阵与表示变换的矩阵相乘得到的。例如:
[中心对齐] 矩阵相似的定义 [/中心对齐]
因此,我们可以认为原始坐标系通过矩阵函数的作用转换成了新的坐标系。对象仍然是同一个对象,但在不同的坐标系下表示不同,这就是矩阵乘法的本质。
我们通常使用的基是自然基,即(1,0)和(0,1)。在这种情况下,矩阵改变坐标系,改变的坐标系是矩阵的每一列,每一列代表新的基。实际上,矩阵的每一列也是一个向量,这个向量的基是自然基。
我们可以从两个角度理解线性变换,即Aa=b。
角度一,矩阵A将向量对象从a移动到b,此时坐标系不变(a和b不是同一个对象)。
角度二,矩阵A将向量对象a的基改变为另一个基,在这个基下,向量对象a的坐标表示为b(a和b是同一个对象,在不同坐标系下的不同表示)。