机器学习原来如此有趣！全世界最简单的机器学习入门指南

ECV
2022-03-27 10:25:39 9

有一次，我和我的合伙人Vito讨论了一些热门的技术趋势及其未来的发展前景。Vito提到：“人工智能将会带来一场规模与信息革命相媲美的革命，而虚拟现实将像移动互联网一样普及，个性化服务也将成为主流。”

如果人工智能技术的变革确实能与工业革命相提并论，那么它必将成就一代人，同时淘汰另一代人。实际上，人工智能已经深入到我们的日常生活之中。从iPhone里的Siri到各大网站的内容推荐系统，再到图像识别和人脸识别技术的广泛应用，这些场景背后都有人工智能技术的身影。

作为程序员，我们与人工智能的关系尤为密切。现在几乎所有规模较大的互联网公司都有专门研究算法的团队。在数据挖掘、反垃圾邮件、推荐系统和广告系统等领域，我们或多或少都会接触到一些机器学习技术。即使我们不直接参与这些技术的开发和维护，也会在工作中频繁地与之互动。

我想强调的是，无论从事什么行业，都应该了解一些人工智能相关的知识，因为这是不可避免的未来趋势。即使是那些尚未涉足该领域的工程师，这项技术的独特性也值得他们花时间去了解。一旦掌握，你会发现这是一种全新的编程方式。

本文旨在向所有没有接触过人工智能技术的程序员（甚至非技术人员）介绍神经网络和深度学习方面的知识。也许，当你读完这篇文章后，会像我第一次接触它们时一样，惊叹于其强大的功能。

接下来，我们将探讨感知器的概念。感知器是一种早期的神经元结构，在上世纪五六十年代就被提出。尽管现在它在神经网络中已较少使用，但理解它有助于理清其他类型神经元的基本结构和设计思路。

感知器的定义元素包括多个输入（x1, x2, x3等），每个输入对应一个权重值（w1, w2, w3等），以及一个阈值（threshold）。输出取决于输入的加权求和与阈值的大小。例如，如果w1x1 + w2x2 + w3x3 + … > threshold，则输出为1，否则输出为0。这相当于一个决策模型，输入表示决策时需要考虑的因素，权重表示对某个因素的重视程度，而阈值则表示决策事件本身的接受程度。

为了更好地理解感知器，我们举一个例子：假设周末有一个同学聚会，你正在决定是否参加。你考虑的因素包括天气、讨厌的人和喜欢的人。根据权重和阈值，你可以计算出最终的决策结果。

单个感知器能做的事情有限，要做复杂的决策，我们需要将多个感知器连接起来。这就引出了神经网络的概念。神经网络通过调整权重和偏置参数，来学习并改进其输出。通过训练数据，神经网络可以自主学习，并找到最合适的参数值。

接下来，我们将介绍sigmoid神经元。sigmoid神经元与感知器结构类似，但其输入和输出可以是任意实数。sigmoid神经元的输出经过sigmoid函数的计算，使其成为一个平滑、连续的函数。这使得逐步调整参数值的训练成为可能。

为了展示神经网络的具体应用，我们引入了一个经典案例：利用神经网络对手写数字进行识别。这个案例使用了一个由Michael Nielsen提出的神经网络结构，该网络包含784个输入、15个隐藏层节点和10个输出层节点。通过训练，这个网络能够达到95%以上的识别率。

在训练过程中，我们使用梯度下降算法来逐步调整权重和偏置参数。梯度下降算法类似于小球在山谷中滚动，最终到达谷底。为了提高效率，人们使用了随机梯度下降算法，每次学习只选取一部分训练数据进行计算。

深度神经网络通过多层隐藏层进行抽象，从而具备了更强的学习能力。然而，训练深度网络需要大量计算资源和时间，且容易出现过拟合问题。尽管如此，深度学习仍是一项前景广阔的技术。

最后，我们回顾了深度学习的优点和缺点。优点包括无需手动编写复杂算法，而缺点则包括需要大量计算资源、容易过拟合等问题。尽管如此，深度学习依然是一项非常吸引人且前景广阔的领域。

图灵汇

责任编辑：： ECV

声明：本文系图灵汇原创稿件，版权属图灵汇所有，未经授权不得转载，已经协议授权的媒体下载使用时须注明"稿件来源：图灵汇"，违者将依法追究责任。

机器入门指南学习原来如此有趣全世界简单

人工智能展

2022-04-01

一文看懂什么是机器学习？到底有什么用？