机器学习概念简介及算法初步
作者头像
  • 金纱
  • 2020-06-28 09:13:17 3

引言

定义一套函数(model) -> 函数的好坏 -> 选择最优函数的过程。

学习地图

下图展示了不同类型的任务之间的关系,其中不同颜色代表同一类别的事件。

  • 情境(Scenario):指学习的环境,通常不受我们控制。例如,当没有数据可用时,我们可能会转向强化学习。如果有数据可用,监督学习通常更为有效。

  • 任务(Task):指需要解决的问题。任务的性质取决于所寻找的函数的输出类型,如回归(输入为数值)、分类(输入为类别)等。

  • 模型(Model):指用于解决问题的数学工具。对于同一任务,可以采用多种模型,如线性模型、非线性模型(深度学习、支持向量机、决策树、K-近邻等)。

监督学习

监督学习需要大量的标注数据,这些数据告诉我们输入和输出之间的关系。标注数据通常由人工完成,这需要大量的工作量。

回归

回归是一种任务,其特点是输入为一个数值,输出也为一个数值。例如,预测未来几天的PM2.5浓度。

分类

分类与回归的主要区别在于输入的数据类型不同。在分类任务中,输入可以是二元的(二分类)或多类的(多分类)。

二分类

在二分类任务中,输入是“是”或“否”。例如,垃圾邮件过滤器需要判断一封邮件是否为垃圾邮件。

多分类

在多分类任务中,输入是多个选项中的一个。例如,新闻分类需要判断一篇新闻属于哪个类别。

模型选择

在解决问题的过程中,首先要选择一个函数集合。选择不同的函数集合将产生不同的结果。常见的模型包括线性模型和非线性模型(如深度学习、支持向量机、决策树、K-近邻等)。

半监督学习

半监督学习适用于有少量标注数据和大量未标注数据的情况。例如,区分猫和狗的图像识别任务中,可以利用未标注的数据辅助模型学习。

迁移学习

迁移学习适用于从大量相关或不相关的数据中获取知识。例如,在猫狗分类任务中,可以利用其他图像数据来提升模型性能。

无监督学习

无监督学习是在没有任何标注的情况下,让机器自行学习。例如,通过阅读大量文本,机器可以学会词汇的意义。或者通过观察大量动物图像,机器可以学会识别不同类型的动物。

结构化学习

结构化学习涉及处理具有复杂结构的数据,如语音识别、机器翻译、人脸识别等。生成对抗网络(GAN)也是一种结构化学习的方法。

强化学习

强化学习与监督学习的不同之处在于,它不需要提供正确的答案,而是通过奖励或惩罚来引导模型学习。例如,训练聊天机器人时,通过用户反馈来改进机器人的表现。在下棋任务中,强化学习让机器通过自我博弈来提高技能。

结合监督学习和强化学习,AlphaGo通过学习棋谱和自我对弈不断进步。

更多内容欢迎关注我的微信公众号“Sakura的知识库”。

    本文来源:图灵汇
责任编辑: : 金纱
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
算法初步概念机器简介学习
    下一篇