机器学习速成课:成绩构建(特征、标签、样本、模型、回归与分类)
作者头像
  • 硅谷密探
  • 2019-06-13 09:05:11 0

在本教程中,我们将深入了解如何将任务转化为机器学习问题,并探讨机器学习中的一些基本概念。

首先,让我们了解一下监督式机器学习的概念。监督式机器学习是一种重要的技术,它使系统能够在给定输入的情况下预测未知数据的输出。在这个过程中,已知部分数据及其相应的标签,然后利用这些数据建立模型,并选择合适的损失函数来评估模型预测结果与实际结果之间的差异,从而不断优化模型。

接下来,我们将介绍几个关键术语:特征、标签和样本。这些术语对于理解机器学习至关重要。

  • 特征:特征是指用于描述数据的输入变量。在简单的线性回归中,特征可以看作是自变量x。特征的数量可以非常庞大,从一个到数百万个不等。例如,在垃圾邮件过滤器中,特征可能包括邮件文本中的词汇、发件人和收件人的地址,以及其他可以从邮件中提取的信息。

  • 标签:标签是模型需要预测的真实目标,相当于因变量y。例如,在垃圾邮件过滤模型中,标签可能是“垃圾邮件”或“非垃圾邮件”。

  • 样本:样本指的是数据的具体实例,包含特征和标签。有标签样本用于训练模型,而无标签样本则用于对新数据进行预测。例如,一封未标记的新邮件包含特征信息,但没有标签值,我们需要对其进行分类,决定将其放入收件箱还是垃圾邮件文件夹。

此外,我们还将讨论模型的概念以及回归与分类的区别。模型是用来描述特征和标签之间关系的工具,通过学习过程获得最佳参数。机器学习的核心在于训练和推理两个阶段:训练阶段涉及模型的学习过程,而推理阶段则是将训练好的模型应用于新数据进行预测。

  • 回归:回归模型主要用于预测连续值。例如,它可以用来预测股票价格、房价或者用户点击广告的可能性。

  • 分类:分类模型则适用于预测离散值。例如,它可以帮助判断一封邮件是否为垃圾邮件,一张图片中的动物是猫还是狗。

总之,通过本教程,我们学会了如何将任务转换为机器学习问题,并掌握了监督式机器学习的基础知识。希望这些信息对你有所帮助。

    本文来源:图灵汇
责任编辑: : 硅谷密探
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
速成样本构建模型回归特征机器成绩标签学习
    下一篇