随着21世纪第三个十年的到来,人工智能和机器学习已经经历了六七年的热潮。从2012年Hinton团队在ImageNet比赛中使用神经网络模型获得冠军开始,AI技术频繁突破。2014年吴恩达在Coursera开设了机器学习课程,2015年周志华教授出版了《西瓜书》,而2017年李彦宏驾驶无人驾驶车上五环,AlphaGo战胜围棋高手,波士顿动力机器人学会后空翻,人工智能达到了前所未有的高度。
——[b]人们认为,新时代即将到来,生活将被彻底改变。[/b]
然而,到了2020年,尽管人工智能和机器学习仍然热度不减,但没有出现令人惊叹的新技术。与前几年相比,机器学习在媒体上的热度有所下降。
[b]那么,机器学习还值得学习吗?是否已经陷入内卷?[/b]
[b]现在学习机器学习还来得及吗?[/b]
让我分享一个故事:
几年前,一位同事带着熬夜抢购到的iPhone来到公司,大家都围过去看。她的手机屏幕锁着,但她面带微笑,把手机靠近自己的脸——手机解锁了!大家当时都感到非常惊讶,以为这是黑科技。但在今天,人脸识别技术已经普及,大家可能会觉得这没什么特别的。
这个故事说明了技术进步的速度之快。[b]一项新技术从实验室走向工业应用,几乎是无缝对接的。[/b]
实际上,机器学习真正引起关注,是从深度学习的出现开始的。作为一种革命性的技术,深度学习将AI提升到了一个新的高度。虽然新的技术突破尚未出现,但机器学习和深度学习已经在数据分析、计算机视觉、自然语言处理、自动驾驶和机器人等领域广泛应用。
[b]因此,深度学习之后的主要发展,不仅仅是技术的进步,更是应用场景的扩展。[/b]
因此,我的观点是:[b]机器学习并没有陷入内卷,它正在从学术领域走向实际应用,成为一种实用技术。[/b]
未来的AI世界会有两种人:一种是持续追求AI创新的算法工程师和数据科学家,另一种则是机器学习的应用者,对他们而言,机器学习就像编程语言或办公软件一样,是一种解决问题的工具。
第二种人将会更多,也会同样重要。
也就是说,只要你从事与大数据或IT相关的工作,你都需要掌握一些机器学习的知识和技能。即使你的目标不是成为一名机器学习或算法工程师。
也许: [list]你需要预测未来的业务数据——可以使用回归和分类模型;你需要处理大数据——例如开发或优化推荐系统;你需要从非结构化图片中提取特征——例如为产品加入人脸识别功能;你需要通过强化学习训练智能体——例如训练更聪明的聊天机器人。[/list]
下图展示了一些机器学习的种类和应用场景,供参考(覆盖可能不够全面,因为机器学习的应用范围变化很快)。
[b]这本书正是为那些需要“懂”机器学习并在工作中使用机器学习技能的人而写的。[/b]
市面上有很多深奥的理论和复杂的算法教程,但很少有从零基础开始,手把手教你“用”机器学习的教程。
这就像一个人去驾校学车,教练却带他走进了造汽车的工厂,告诉他:“小伙子,我们详细讲一讲你面前的这辆车是如何制造的。”
[b]——这样不合适,顺序反了。[/b]
[b]应该先学会开车,然后再去了解汽车的内部构造。[/b]
为什么我如此看重“开车”而不是“造车”?这与我的职业经历有关。
我是一名技术顾问,年轻时出过几本关于SAP的书,后来一直在一家大客户那里负责SAP系统的实施和维护,生活平静如水……
直到有一天,大客户告诉我们SAP许可证太贵了,准备停用,转而上云。于是我们开始寻找云软件,替代SAP。
从那时起,我们的生活不再平静。大家各显神通,经历了一系列培训,最终我们都成了云计算、AWS、Azure和各种SaaS供应商的专家,为客户提供了云解决方案。
然而好景不长,客户成功上云后,我们再次面临无事可做的困境。
新的增长点在哪里? 经过反思,我们发现两个主要发现: [list]Workday、Salesforce这样的SaaS软件和AWS等云服务太好用了,让客户从繁琐的业务流程中解脱出来;客户开始关注他们积累的数据,并希望我们能利用这些数据解决运营或增长方面的高附加值问题,即产生洞察力,优化运营。[/list]
客户的第一个新项目是通过收集用户信息,对用户进行画像,找出高欺诈风险的群体,并对他们进行更严格的监管。
另一个客户面临的挑战更大——他们是印尼的一个大型造纸商,拥有上万公顷的森林,每年需要派出大量人力物力深入森林勘察,判断哪些区域的森林已成熟,值得砍伐。
新项目接踵而至。 我们发现——这些“新”的“不同”类型的项目,[b]无一例外地与数据相关,与“机器学习”相关。[/b]
如果你了解一些AI的具体技术,你应该知道第一个项目就是一个典型的机器学习任务,而第二个项目可以通过使用无人机拍摄海量视频和图片数据,再通过深度学习的方法识别图像中的颜色和形态,从而智能定位成熟或发育不良的林区,精准施策。
从那时起,我们又变身成了“机器学习”应用专家。
——其实,这个转变过程与我在《零基础学机器学习》书中所描述的故事相似。
说了这么多,这些事情与这本书的创作有什么关联呢? 作为一个咨询顾问,我的创作目的是:从实际出发,[b]强调“机器学习的应用过程”,想象着有一群像我一样的读者,从零基础开始学习,应该如何逐步深入,不多不少,恰如其分地给出他们入门机器学习所需的知识?以节省他们的时间和精力。[/b]
因此,这本书记录了我在机器学习项目实战过程中发现的对实际工作最有价值的内容,可以帮助“应用型”的读者顺利入门机器学习。
[b]那么,如何入门机器学习呢?[/b]
[b]这里总结一个较为轻松的入门路径,无论是否阅读《零基础学机器学习》,都可以参考。[/b]
[size=6]① 打消畏难情绪[/size]
首先要打破的刻板印象是——机器学习很难,里面有一大堆算法。
很多人因为信息过载,初学者往往不知道从哪里开始,一开始就被大量的新概念和算法吓倒。
[b]大家要放心,机器学习其实并不难!相比于前端/后端、Java、C++、微服务和分布式系统开发等互联网技术,入门机器学习不仅不难,反而非常简单。[/b]
在《零基础学机器学习》中,我特意设置了两个角色:咖哥引导小冰入门。
这本书通过小冰的学习过程,串联起整本书的学习流程。初学者容易遇到的问题,小冰这个AI小白都会碰到,此时技术专家咖哥则从各种角度给予指导。有小伙伴一起,你也可以轻松快速地入门机器学习!
[size=6]② 打牢基础[/size]
在此基础上,增加机器学习必备的基础知识和实战架构,这是最重要的内容。
[b]记住,无论学习哪一个领域,大家都要一开始就看到全貌,这样才能有的放矢。[/b]
下图是机器学习入门需要掌握的内容,学习起来一点也不累。只需要花费不到一周的时间,就可以打好入门基础。
夯实这些基础知识后,我们就可以开始实践了。
[size=6]③ 从实战出发解决实际问题[/size]
解决了“入门难”的问题后,下一个关键点是“我们要用机器学习做什么?”
学一样东西,如果没有看到学了之后具体有什么用,怎么用,那就几乎是在浪费时间。
所以,如果你想让你的学习有成果,就必须强调实战。
实战案例的选择,需要具备实用性,例如银行客户流失率预测、疾病风险评估、网站用户聚类等。你可以在Kaggle网站上寻找数据集、训练机器,参加机器学习竞赛。只有解决了实际问题,才能真正理解机器学习是怎么回事。
对我来说,所有脱离实际应用的理论都不是为入门阶段的读者准备的,所以在书中我也准备了大量的训练项目。此外,我还增加了一个小设计——
一般的课程思路是这样的: [b]讲解理论→介绍工具→解决问题[/b]
这本书的设计思路是这样的: [b]提出问题→讲解理论→介绍工具→解决问题[/b]
这一小设计,会让待解决问题在整个学习过程中始终在我们的脑海中打转,也让学习过程充满目的性。
[b]以结果为导向,是我在学习过程中特别强调的。[/b]
[size=6]④ 总结出一个实战套路反复练习[/size]
重点来了,有了学习目标,还需要一个完善且经过验证的套路,方便大家检验习得的技能。
那么,机器学习实战有套路吗?
有!请看下图:
这是在机器学习项目实践中总结出来的流程,在书中所有具体的机器学习项目实战章节中,全部采用同一个实战套路。
具体内容包括: [list]线性回归,逻辑回归,深度学习,卷积神经网络,循环神经网络,集成学习,非监督学习,生成对抗网络,强化学习等[/list]
反复练习各种机器学习模型,强化上述套路,每强化一次,你就会觉得机器学习越来越简单,也越来越有趣。
下图是《零基础学机器学习》为新手精心设计的入门路径。
好了,说了这么多书的事,我们回到文初的问题:[b]机器学习内卷了吗?[/b]
[b]——机器学习当然没有内卷,它只是被越来越多的人了解,被越来越多的企业应用,正在渗透到我们生活的方方面面。这叫做落地,而不是内卷。[/b]
[b]运用机器学习技术,去解决工作和生活中的具体问题,在数据中提炼价值,是一件多么酷的事情![/b]
本书旨在让非机器学习领域的读者,甚至是非计算机专业的读者,轻松掌握机器学习的基本知识,从而具备实战能力。本书通过AI“小白”小冰拜师程序员咖哥学习机器学习的对话展开,内容轻松,实战性强,涵盖了机器学习快速上手路径、数学和Python基础知识、基础算法(线性回归和逻辑回归)、深度神经网络、卷积神经网络、循环神经网络、经典算法、集成学习、非监督和半监督学习类型、强化学习实战等内容,以及相关实战案例。所有案例均通过Python及Scikit-learn机器学习库和Keras深度学习框架实现,还包含丰富的数据分析和数据可视化内容。
本书适合对AI感兴趣的程序员、项目经理、在校大学生以及任何想从零基础开始学习机器学习的人,用以入门机器学习领域,建立从理论到实践的知识通道。