在讨论机器学习之前,我们需要明确一个观点:机器实际上并不会真正地“学习”。所谓的“机器学习”只是在寻找一个合适的数学公式。一旦找到这个公式,我们就可以将一组输入数据(即训练数据)代入其中进行运算,并将结果与正确的答案进行对比。我们希望这个公式能够对大多数新的、来自不同统计分布的输入数据给出正确的结果。
然而,为什么我们认为这并不能算是真正的学习呢?这是因为如果输入数据发生了巨大的变化,那么新的运算结果可能会与预期大相径庭。相比之下,动物的学习过程则完全不同。例如,人们通常可以在电脑或手机上玩游戏。即使屏幕倾斜或旋转,也不太会影响游戏体验。但如果用一个机器学习算法来玩游戏,除非它专门针对屏幕变化进行了优化,否则很可能无法适应这种变化。
既然如此,为什么我们仍然称其为“机器学习”呢?这一称呼在很大程度上是为了吸引客户和高水平人才的一种市场宣传手段。“机器学习”这一概念最早是由美国计算机游戏和人工智能领域的先驱人物亚瑟·塞缪尔(Arthur Samuel)于1959年提出的。当时他在IBM工作。这个概念在当时非常流行,帮助公司吸引了大量关注。随后,在2010年左右,IBM又提出了“认知计算”的概念,进一步巩固了其市场地位。
尽管如此,人工智能并不是真正的智能,机器也无法真正学习。但这并不妨碍“机器学习”成为广泛接受的一个术语——一种构建计算机系统的方法论。通过这种方法,我们可以构建出不需要明确编程指令就能得出正确结果的系统。总而言之,“机器学习”只是一个比喻性的说法,并不是严格意义上的学习过程。
《机器学习精讲》这本书将带给你哪些知识呢?
本书以简洁的语言介绍了机器学习领域必备的知识和技能。全书分为11个章节和一个术语表,依次介绍了机器学习的基本概念、符号和定义、算法、基本理论方法、神经网络和深度学习、问题及解决方案、高级操作、无监督学习及其他学习方式等内容。书中涵盖了监督学习、无监督学习、支持向量机、神经网络、集成学习、梯度下降、聚类分析、降维、自编码器、迁移学习、强化学习、特征工程和超参数调优等众多核心概念和方法。最后一部分提供了一个详细的术语表,帮助读者更好地理解机器学习的工作原理,为进一步研究打下坚实的基础。
本书适合想要学习和掌握机器学习的软件开发人员、希望运用机器学习技术的数据科学家以及想要了解机器学习的一般读者阅读。
本书适合想要学习和掌握机器学习的软件开发人员、希望运用机器学习技术的数据科学家以及想要了解机器学习的一般读者阅读。