尽管机器学习已经成为一个热门话题,但对于大多数人来说,它仍然显得陌生且难以捉摸。为此,著名投资人本尼迪克特·埃文斯在他的博客上发表了一篇文章,分享了他对这一问题的看法。雷锋网对其进行了翻译。
机器学习已经流行了四五年,除了新兴的人工智能公司,各大科技巨头也希望通过这个流行词汇重新塑造自己。再加上媒体的广泛报道,机器学习已经深入人心。总的来说,机器学习被视为下一个能够推动发展的风口。
在深入了解机器学习之前,我们需要先明确几个概念:人工智能、机器学习、神经网络和深度学习之间的关系。简单来说,人工智能涵盖了最广泛的范畴,而机器学习是实现人工智能的一种方法。神经网络是机器学习中的一个重要组成部分,而深度学习则是机器学习的一个子集,它通过神经网络实现更加复杂的学习过程。
虽然许多人对神经网络有了一定的认识,但机器学习仍有很多需要探讨的地方。机器学习使计算机能够在数据中找到复杂的模式,而这些模式以前只能由人类发现。通过机器学习,计算机解决了许多以前难以解决的问题,各家公司也展示了它们的技术实力。
然而,机器学习的定义仍然存在争议。对于科技公司和整体经济来说,机器学习意味着什么?它能解决哪些重要的问题?对于普通人来说,它又意味着什么?如何从结构上理解机器学习的影响?
这时,有人可能会提到人工智能这个概念,但人工智能本身并不能完全回答这些问题。它更像是一个谜题,而我们在解开这个谜题的过程中还有很多未知数。
一些关于机器学习的常见误解包括: 1. 数据是新的石油 2. 谷歌和中国垄断了所有的数据 3. 人工智能将取代所有的工作 4. 只谈论人工智能
也许,我们可以从其他角度看待机器学习,例如自动化、为技术赋能以及关系数据库。关系数据库是一种新的基础设施,它可以扩展计算机的能力。在关系数据库出现之前,数据库缺乏结构,无法轻易地进行交叉引用查询。关系数据库的出现使得数据库成为了商业智能系统的一部分。
关系数据库的引入改变了企业的运作方式,催生了许多新的应用。例如,SAP 和甲骨文公司就是基于关系数据库发展起来的。关系数据库的应用使得企业能够实现全球无库存供应链,从而支持苹果和星巴克等公司的成功。
因此,机器学习的发展应该借鉴关系数据库的成功模式。它将为计算机带来更大的能力提升,并成为不同公司和产品的一部分。最终,机器学习将成为一项常见的技术,不再引起过多关注。
机器学习确实依赖于数据,但数据往往与特定的应用场景相关联。更多的数据可以提高机器学习的效果,但这并不意味着数据之间可以相互补充。这就是机器学习的残酷之处,数据是不可替代的。
机器学习并不是一个单一的通用工具,它需要不同的实现方式和数据。例如,洗衣机虽然是机器人,但它们并不具备智能。机器学习同样需要不同的实现方式和数据,才能解决各种问题。
在讨论机器学习时,我们需要找到数学解释和人工智能幻想之间的平衡。机器学习确实可以在特定的数据中找到问题的答案,但它并不总是适用于所有问题。例如,Instacart 公司使用机器学习优化了个人买家的投资路径,提高了效率。律师也可以利用机器学习搜索特定的邮件内容。
机器学习还能够分析新的数据类型,如音频、图像和视频。图像数据尤其有趣,因为计算机能够识别图像内容,从而开启新的应用领域。
机器学习并不是要取代人类的智慧,而是通过自动化来提高效率。例如,机器学习可以帮助识别图像中的褶皱,从而自动化一些简单的任务。这有助于我们思考人工智能偏见的问题,但也有限制。机器学习可以在短时间内学习大量的数据,但它不能替代人类的常识和智力。
机器学习的主要功能在于自动化一些重复性任务。例如,接听电话并筛选出情绪激动的通话,阅读邮件并筛选出充满焦虑的内容,浏览大量图片并识别出有趣的人物。机器学习不需要成为经验丰富的专家,而是通过自动化提高效率。
在某些领域,机器学习可能无法发现人类已经认识到的模式,但它可以发现人类尚未注意到的模式,如Deepmind的AlphaGo。AlphaGo通过自我对弈学习围棋规则,而不是像人类那样下棋。机器学习在处理大量数据时,可以发现人类难以察觉的模式。
机器学习在许多领域都有应用前景。尽管已经有一些成熟的应用案例,但机器学习仍有很大的发展空间。例如,自动驾驶汽车和混合现实技术都受益于机器学习。随着技术的进步,机器学习将继续带来更多创新和机遇。
via ben-evans,雷锋网编译。