机器学习:关于学习模型方式
作者头像
  • 乔佳
  • 2019-10-15 06:42:41 2

在生活中,我们经常需要面对各种选择,而机器在处理这些决策时也有自己的路径。这些路径可以通过数学表达的方式进行合理构建。机器学习作为一种正式的学习模型,为我们提供了多种解决问题的方法。

通常,依赖于连续问题的机器学习方法主要有三种,这些方法都建立在信息索引的基础上。

您很快会发现,这些机器学习方法之间存在着特殊的联系。然而,机器学习本身也是一种有效的方法,可以帮助我们在业务中更好地理解和定位各部分之间的次要关系。

依赖于连续问题的三种机器学习方法也基于信息索引,这些索引包括:

监督学习:在监督学习中,我们有一个预先标注好的数据集。通过分析这个数据集,我们可以发现特征和标签之间的联系。例如,当我们比较每个特征向量x和标签1、2、{{}} cyl(c通常从2到100)时,可以将学习结果视为一组分类任务。如果每个特征向量x与真实值R相比,可以将其视为回归任务。从监督学习中获取的信息常被用来期望和验证。

无监督学习:无监督学习适用于未标记的数据集。无监督学习的目标是通过分析数据集中的多个属性来发现潜在的模式。在无监督学习中,我们可以自行学习或私下学习,而无需标记数据。

强化学习:强化学习主要用于解决带有基本指导力的问题,如机器人观察和开发、编程的国际象棋棋手和编程的车辆驾驶。

监督学习策略

监督学习通常采用两种分类器方法:判别式方法和生成式方法。判别式方法专注于将特征向量映射到标签,而生成式方法则更注重描述每个标签的可能性分布。判别模型试图说明分类器提供的特征向量的概率分布,而生成模型则描述了在给定每个标签的情况下,分类器的概率分布。

我们的目标是找到一种模型,既能删除大量冗余信息,又能避免过度拟合和欠拟合,从而提供最佳的学习效果。在选择模型之前,我们需要了解不同模型的复杂性以及如何实现它们。通常有三种技术可以达到这一目的:

  1. 不同类型的实际集分类和目标能力:不同的实际集类型(例如KNN、决策树和直接分类器)带来了各种模型。

  2. 模型参数:即使在相同的预测集下,通过调整模型参数,也可以改变实际集的效果。例如,在KNN中,不同的K值可能会带来不同的学习效果。SVM和多层感知器的应用也需要设置一些参数。

  3. 维度变化:改变特征向量的维度可以带来不同的模型效果。有许多策略可以优化特征向量的维度,前提条件是能够定义整体结构。

模型选择

选择最佳模型,以便从数据中提取大量信息,避免过度拟合和欠拟合,并为正在进行的任务提供最佳的学习表现。

正则化

通过正则化来调整Em(g)和模型复杂度,以确保模型的稳定性和泛化能力。

三项学习原则

在过去的两节中,我们讨论了如何创建和选择最佳模型。以下是AI用户应牢记的三个原则:

  1. 奥卡姆剃刀原则:在两个可以达到相同效果的模型中,更简单的那个是更好的选择。

  2. 测试倾向:如果只考虑部分测试信息,学习结果可能有偏差。例如,如果只在线评估“互联网如何影响您的生活?”,结果可能无法全面反映实际情况,因为不愿意使用互联网的人可能会错过这个测试。

  3. 信息监测:如果信息收集影响了学习过程的任何环节,就不能完全依赖调查结果。

    本文来源:图灵汇
责任编辑: : 乔佳
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
学习模型机器方式关于
    下一篇