闲在家里,正好来了解一下AI,一文带你走近机器学习
作者头像
  • 廖佳玮
  • 2020-02-23 19:55:53 3

机器学习概述与应用

本文旨在从初学者的角度系统介绍机器学习的基本概念、发展历程、研究内容、现有方法及未来趋势等内容,并进行总结。在研究内容和已有方法部分,特别介绍了弱监督学习和贝叶斯算法。此外,本文还比较了机器学习与专家系统的区别,并以一些值得深思的问题结束了全文。

一、概念科普

什么是机器学习?

机器学习利用计算机模拟人类的学习方式,通过训练数据来生成算法,并用测试数据验证算法的准确性。随后,算法利用历史数据生成的经验做出有效决策。作为人工智能的基础技术,机器学习不仅具备快速处理计算机数据的能力,还能预测和分类数据。

机器学习的核心目标是使计算机能够模拟人类的学习行为,包括识别现有知识、获取新知识、不断优化性能和自我完善。例如,计算机可以通过大量标注图片来学会识别图片内容。

除了理解机器学习的概念,还需要熟悉一些相关的专业术语,如特征值、训练数据、测试数据、拟合、迁移学习和参数模型等。

二、发展历程

机器学习的历史可以追溯到1949年赫布理论的提出,但其发展并非一帆风顺。20世纪70年代,机器学习曾遭遇瓶颈。然而,随着大数据时代的到来,机器学习得以复苏。根据大数据时代的背景,机器学习的发展历程可分为浅层学习和深度学习两个阶段。

(1)小数据时代(浅层学习)

1949年,赫布理论的提出标志着机器学习迈出第一步。1952年,Arthur Samuel设计了一个西洋跳棋程序,这被认为是机器学习的早期里程碑。IBM首次定义并解释了机器学习。

1957年,Rosenblatt发明了感知器模型,这种模型被认为是人工神经网络中的典型算法。随后,Widrow提出了Delta学习规则,即最小二乘法。然而,1969年Minsky指出感知器的局限性,直到80年代末BP算法才被广泛应用。

1990年代,浅层学习迎来了黄金时期,各种模型相继问世,并在实际应用中取得了巨大成功。

(2)大数据时代(深度学习)

随着数据收集和处理能力的提升,机器学习进入深度学习时代。深度学习通过大量数据训练模型,实现更准确的分类和预测。2006年,Geoffrey Hinton等人提出深度学习理念,引发了学术界和工业界的广泛关注。

三、主要研究内容

机器学习的研究内容主要包括有监督学习、无监督学习、弱监督学习、强化学习和迁移学习等。

(1)有监督学习

有监督学习是指机器学习的数据带有标签,这些标签可以是数据类别、属性或特征点位置等。通过大量带标签的数据训练模型,不断修正预测结果,最终生成鲁棒性强的模型。有监督学习包括分类和回归两种常见形式。

(2)无监督学习

无监督学习是指数据没有标签,机器需要从无标签数据中挖掘潜在联系。常见的无监督学习包括聚类和降维。

聚类是将数据按相似性分组,降维则是通过减少数据维度来简化分析过程。

(3)弱监督学习

弱监督学习是指通过少量带标签的数据训练模型,包括不完全监督、不确切监督和不准确监督三种类型。这类学习方式因其低成本和高效率,在实际应用中非常常见。

(4)强化学习

强化学习是一种带激励的学习方式,机器根据正确的行为获得奖励,错误的行为则受到惩罚。这种学习方式具有动态规划的思想,常用于游戏等领域。

(5)迁移学习

迁移学习是指将一个任务上学到的知识应用到另一个任务上。它通常分为选择模型、重用模型和调整模型三个步骤。迁移学习适用于多种领域,如自动化、图像识别和翻译等。

四、已有方法及优缺点

本文介绍了机器学习的主要分类及其对应的算法。以下是几种常用的算法:

(1)贝叶斯算法

贝叶斯算法广泛应用于机器学习中,从分类和回归到模型识别都有其身影。常见的贝叶斯算法包括朴素贝叶斯和非参数贝叶斯。

  • 朴素贝叶斯:假设所有属性相互独立,具有简单高效的特点,但在实际应用中可能存在偏差。
  • 非参数贝叶斯:具有较强的描述数据能力,尤其适合处理大数据环境下的复杂问题。
(2)决策树算法

决策树算法是机器学习中的一种经典算法,通过信息熵计算来确定特征的重要性,从而实现数据分类。

(3)K最近邻算法

K最近邻算法是一种简单的分类算法,通过计算距离来分类数据,适用于讨论数据相关性。

五、当前应用及研究趋势

(1)当前应用及产生的问题

机器学习在多个领域得到广泛应用,例如在医学领域,神经网络模型已被用于辅助诊断。在烧伤护理领域,机器学习同样展现出巨大潜力。此外,机器学习在翻译领域的应用也日益增多,尽管面临一些挑战,但仍显示出显著优势。

(2)研究趋势

从算法角度看,大数据贝叶斯学习逐渐成为研究热点,如何提高其灵活性和推理速度是未来的主要研究方向。集成学习也是当前研究的热点之一,它通过组合多个模型来提高整体性能。

六、结论

人类的学习能力无疑优于机器,但机器学习可以克服人类处理数据的单调性和信息处理的困难。身处大数据时代,如何提高机器学习处理海量数据的能力,设计更优算法以推广弱监督学习,利用机器学习的优势弥补人类不足,这些都是值得我们深思的问题。

参考文献

  • 石弘一:《机器学习综述》;
  • 陈凯、朱钰:《机器学习及其相关算法综述》;
  • 詹骐源:《机器学习的发展史及运用前景》;
  • 赵晨阳:《机器学习综述》;
  • 朱军、胡文波:《贝叶斯机器学习前沿进展综述》;
  • Tae-Woo Kim:《神经网络机器学习在牙齿提取诊断中的新方法》;
  • Nehemiah T., Liu, Jose Salinas:《机器学习在烧伤护理和研究中的应用》;
  • Gary Massey Maureen, Ehrensberger-Dow:《机器学习对翻译教育的影响》;
  • Arie Ben-David, Eibe Frank:《机器学习模型与“手工”专家系统在信用评分案例中的准确性对比》;
  • Web-based机器学习用于语言识别和翻译。
    本文来源:图灵汇
责任编辑: : 廖佳玮
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
好来一文走近家里机器了解一下学习
    下一篇