到底什么是机器学习?机器学习能做些什么?
作者头像
  • 王慕昂
  • 2020-06-26 11:07:26 2

最近,我参加了一次朋友的晚宴,他们询问我的职业,我回答说:“我从事机器学习方面的工作。”

朋友的妻子好奇地问丈夫:“亲爱的,机器学习到底是什么?”

她丈夫笑着回答:“T-800型终结者。”

在《终结者》系列电影中,T-800是人工智能技术的反面样板,但实际上,机器学习与T-800的关联不大。机器学习是指通过数据训练计算机,使其能够发现数据背后的规律和模式,而不是简单的模仿或拟人化行为。

现在,机器学习已经应用于许多领域,远远超出了人们的预期。例如,假设你在准备一张生日贺卡:

  • 你在网上搜索贺卡,搜索引擎会根据你的点击行为优化未来的搜索结果。
  • 当你查看邮箱时,垃圾邮件过滤器会自动将广告邮件移至垃圾箱。
  • 在购买贺卡时,你可能还会选购尿布,收银员会给你一张优惠券,因为数据分析显示,购买尿布的人往往会买啤酒。
  • 当你邮寄贺卡时,手写识别软件会自动识别地址并将贺卡送至正确的邮车。
  • 在贷款申请过程中,计算机会分析你的财务记录,以判断你是否符合条件。
  • 去赌场时,安全系统可能会阻止某些可疑人物进入。

这些场景都涉及到了机器学习的应用,比如人脸识别、手写数字识别、垃圾邮件过滤和商品推荐等。目前,许多公司利用机器学习来改善商业决策、提高生产效率、检测疾病、预测天气等。

传感器和海量数据

虽然我们已经从互联网上获得了大量人为数据,但最近出现了更多来自传感器的非人为数据。传感器技术正在兴起,但如何将它们连接到互联网仍是一项挑战。据预测,20%的互联网非视频流量将由物理传感器产生。

地震预测是一个典型例子。传感器收集了大量的数据,如何从中提取有价值的信息是一个重要研究课题。例如,1989年的洛马·普列埃塔地震导致63人死亡,3757人受伤。相比之下,2010年海地地震的死亡人数超过23万。如果要改进地震预测研究,我们需要更好地理解环境因素,这需要投入更多的资源和创新手段。

机器学习的重要性

在过去几十年里,许多工作从体力劳动转变为脑力劳动。现在的工作往往需要理解和分析复杂的数据,机器学习可以帮助我们处理这些问题。正如谷歌首席经济学家Hal Varian所说,统计学家将成为未来的重要职业。如何解释数据、处理数据、从中提取价值、展示和沟通数据结果,将成为关键技能。

Python语言的优势

Python语言因其清晰的语法、易于操作文本文件和广泛的使用范围而成为机器学习的理想选择。Python自带许多高级数据类型,如列表、元组、字典等,使抽象的数学概念更容易实现。此外,Python处理文本文件非常简单,适合处理非数值数据。Python还提供了丰富的正则表达式函数和Web访问函数库,使数据提取变得更加容易。

Python的流行程度

Python语言广泛应用于科学和金融领域,如SciPy和NumPy等科学函数库,这些库实现了向量和矩阵操作,提高了代码的可读性。Python还可以与绘图工具Matplotlib协同工作,绘制2D和3D图形。Python开发环境提供了交互式shell,允许用户实时查看和测试代码。

Python语言的特征

Python语言允许用户执行矩阵操作,类似于MATLAB和Mathematica,但其成本更低,且拥有强大的社区支持。与其他语言相比,Python代码更加简洁易懂,即使非编程人员也能快速上手。尽管Python在性能上不如Java或C,但它可以通过调用C编译的代码来提高性能。这意味着可以先用Python编写实验程序,如果需要,再转换成C代码以提升效率。

Python语言的缺陷

Python的主要缺点是性能问题。然而,Python可以通过调用C编译的代码来弥补这一不足,从而结合两者的优点。例如,可以先用Python编写实验程序,然后在必要时转换为C代码。这种模块化的开发方法可以显著提高程序性能。

总之,机器学习正在改变我们的生活和工作方式。Python作为一种高效且易于使用的编程语言,成为了机器学习领域的首选工具。

    本文来源:图灵汇
责任编辑: : 王慕昂
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
机器学习什么到底
    下一篇