机器学习和引荐系统（九）监督学习（下）

飞啦啦
2019-11-08 07:50:13 3

监督学习（下）

一、分类成绩

在监督学习中，当输入变量Y只有有限的几个离散值时，预测任务就变成了分类任务。监督学习的任务是从数据中学习一个分类模型或分类决策函数，这个模型被称为分类器。分类器用于对新输入的数据进行预测，即分类。分类任务包括学习和分类两个阶段。在学习阶段，根据已知的训练数据集，使用特定的学习方法来训练一个分类器；在分类阶段，则利用已经训练好的分类器对新的输入实例进行分类。分类任务可以通过多种方法来实现，如K近邻、决策树、感知机、逻辑斯蒂回归、支持向量机、朴素贝叶斯和神经网络等。

二、准确率和召回率

评估分类器性能的一个重要指标是分类准确性，它指的是分类器在测试集上正确分类的样本数量与总样本数量的比例。对于二分类问题，常用的评价指标包括准确率和召回率。通常将关注的类别定义为正类，而其余的类别则定义为负类。根据分类器在测试集上的预测结果，会出现四种情况：真正例（TP）、假反例（FN）、假正例（FP）和真反例（TN）。准确率计算公式为：

[ text{准确率} = frac{text{TP}}{text{TP} + text{FP}} ]

召回率计算公式为：

[ text{召回率} = frac{text{TP}}{text{TP} + text{FN}} ]

三、回归成绩

回归任务用于预测输入变量与输出变量之间的关系。回归模型是一种表示输入变量到输出变量之间映射关系的函数。回归任务的学习等价于函数拟合，即选择一条函数曲线，使其很好地拟合不同的数据，并且能够较好地预测未知数据。回归任务可以根据输入变量的数量分为一元回归和多元回归；根据模型类型，可以分为线性回归和非线性回归。在回归学习中，损失函数的选择非常重要，常用的损失函数是平方损失函数。如果选择平方损失函数作为损失函数，回归任务可以通过著名的最小二乘法来求解。

四、模型求解算法 – 梯度下降算法

梯度下降算法是一种广泛使用的优化方法，是求解无约束优化问题的一种简单而经典的方法。梯度方向是指函数变化最快的方向，而负梯度方向则是函数变化最慢的方向。如果损失函数是系数的函数，那么当系数沿着损失函数的负梯度方向变化时，损失函数会减少得最快，从而可以快速下降到极小值。通过沿负梯度方向迭代，每次迭代都会使损失函数的值变得更小。需要注意的是，梯度下降法不一定能找到全局最优解，但当损失函数是凸函数时，梯度下降法得到的解一定是全局最优解。

五、模型求解算法 – 牛顿法和拟牛顿法

牛顿法和拟牛顿法是另一种常用的优化方法，它们通过利用函数的二阶导数信息来更快地找到极值点。与梯度下降法相比，牛顿法通常收敛得更快，但在某些情况下，由于需要计算和存储海森矩阵的逆矩阵，计算成本较高。拟牛顿法则是一种改进，它通过近似海森矩阵来减少计算量。这种方法在实际应用中非常有效，特别是在大规模优化问题中。

希望以上改写内容符合您的需求。

图灵汇

责任编辑：：飞啦啦

声明：本文系图灵汇原创稿件，版权属图灵汇所有，未经授权不得转载，已经协议授权的媒体下载使用时须注明"稿件来源：图灵汇"，违者将依法追究责任。