机器学习深度学习之数学基础:基于初等反射矩阵完成矩阵的QR分解

本文将详细介绍矩阵的QR分解，其中一个重要技术是初等反射矩阵。关于初等反射矩阵的详细解释已在前两章中介绍，如果读者对此不熟悉，建议回顾之前的内容。本文将不再重复介绍这部分内容，以免影响读者的理解。

当n≥m时，矩阵A可以通过一系列初等反射矩阵的操作得到新的矩阵R。相反地，当m>n时，也有相应的操作步骤。无论哪种情况，通过一系列初等反射矩阵的作用，最终会得到特定的结果。

然而，这些细节并不重要。接下来，我们将重点讨论如何利用初等反射矩阵进行QR分解。

假设有一个矩阵A，这个矩阵不需要是方阵。通过s个初等反射矩阵H的作用，可以得到一个新的矩阵R。矩阵A的每一列可以视为一个元素，共有n列，因此共有n个元素(a1, a2, ..., an)。

首先，H1对A进行处理，H1的作用对象是a1。如果a1为零向量，则H1只需为单位向量。为了通用化，这里假设所有向量均不为零。

H1对A进行变换后，可以得到：

接下来，H2对A的剩余部分进行处理，具体操作如图所示。

通过k-1个变换矩阵的作用，最终可以得到：

然后，第k个变换矩阵Hk将对右下角的两个区块ck和dk进行处理，主要是将ck转换为(-σk, 0, ..., 0)的形式。经过s步的操作，最终可以得到：

我们关注的是R矩阵，可以得到：

其中Q1即为前面提到的H1。这样，矩阵A就被分解为A = QR的形式。

QR分解的核心在于利用初等反射矩阵，逐步将矩阵A转化为R矩阵。Q矩阵一定是正交矩阵（即矩阵的逆等于矩阵的转置）。当R矩阵的对角元素均为正值时，这种分解是唯一的。

现在，我们通过一个具体的例子来演示矩阵A的QR分解过程。

通过以上步骤，我们得到了两个矩阵H1和H2。由于H2是二维的，需要扩展为三维矩阵。

最后，我们可以通过H1和H2计算出Q矩阵，从而完成QR分解。

责任编辑：：沃森展览

声明：本文系图灵汇原创稿件，版权属图灵汇所有，未经授权不得转载，已经协议授权的媒体下载使用时须注明"稿件来源：图灵汇"，违者将依法追究责任。

2020-06-06

机器学习十大经典算法之一——决策树CART算法