如何用3个月零基础入门「机器学习」?
作者头像
  • 雷霞
  • 2019-10-23 12:46:58 4

0. 引言

本文旨在帮助那些希望进入或转行至机器学习领域的朋友们。机器学习是当今最具潜力的技术领域之一,许多人希望通过自学掌握这项技能。本文的主要目标是指出一些常见的自学误区,并提供一个实用的学习路径。本文面向的是那些希望零基础自学的读者,对数学、统计和编程的要求并不是很高。

1. 自学机器学习的误区和陷阱

1.1 避免过度补习数学知识

很多人认为在开始学习机器学习之前需要掌握所有的数学知识,但实际上,这种做法往往会拖延学习进程。机器学习课程通常会要求具备线性代数、概率统计、优化理论和微积分等基础知识。然而,不必在一开始就掌握所有这些知识。可以在学习过程中逐步补充欠缺的部分,这样更有效率且更具针对性。

1.2 不要将深度学习作为入门的第一课

尽管深度学习很受欢迎,但将其作为入门的第一课并不是最佳选择。深度学习具有较强的黑箱性质,学习过程中可能会感到困惑。此外,深度学习的硬件要求较高,不太适合初学者在个人设备上进行学习。因此,建议从较为基础的课程开始,逐步过渡到深度学习。

1.3 选择合适的材料并关注时效性

机器学习领域发展迅速,因此选择合适的材料非常重要。很多初学者倾向于收集大量资料,但实际上,这可能导致资源分散。建议选择近期出版且口碑良好的书籍和课程。例如,一些较老的书籍可能已经过时,例如Tom Mitchell的《机器学习》。相比之下,近年来出版的书籍更加符合当前的需求。

2. 机器学习的准备工作

2.1 硬件选择

在入门阶段,大多数数据集都可以在个人笔记本电脑上运行。例如,MNIST数据集就是一个典型的小型数据集,非常适合在个人电脑上进行操作。对于深度学习而言,Windows用户可以通过安装Ubuntu虚拟机来利用GPU进行加速。

2.2 软件选择

Linux系统对许多机器学习模型的支持较好,但Windows系统也可以通过虚拟机安装Ubuntu。对于编程语言,Python是最常用的选择,因为它拥有丰富的库支持。此外,R语言在某些情况下也可以使用。对于编程基础,建议自学一些Python知识。

2.3 英语能力

英语能力对于学习机器学习至关重要,因为大多数书籍、期刊和会议资料都是英文的。即使未来不从事机器学习工作,良好的英文阅读能力也会有很大帮助。

3. 学习路径

3.1 初级阶段:3-6个月

3.1.1 吴恩达Coursera课程

吴恩达的Coursera课程是许多人的入门课程,难度适中且完全免费。该课程受到了广泛的赞誉,可以快速帮助初学者建立起机器学习的基本概念。

3.1.2 Python机器学习与《统计学习导论》

在学习吴恩达的课程时,推荐同时阅读相关的书籍。这两本入门书籍分别是《Python机器学习》和《统计学习导论》。前者专注于Python框架,后者则引入了R语言。这两本书籍都非常适合初学者。

3.1.3 《机器学习》(周志华)

周志华的《机器学习》是一本经典的教材,但建议将其作为参考书,而非主要学习材料。这本书涵盖了广泛的内容,但对于初学者来说可能稍显复杂。

3.2 进阶阶段:3-6个月

3.2.1 Kaggle比赛

Kaggle是一个数据分析社区,提供了许多数据集和比赛。参与这些比赛不仅可以提升技能,还可以获得奖金。此外,Kaggle社区会分享经验和解决方案,有助于解决问题。

3.2.2 Sklearn文档学习

Sklearn是Python中常用的机器学习库,通过阅读其文档可以更好地理解和应用各种模型。Sklearn的文档不仅提供了示例代码,还包含了可视化图表,非常实用。

3.3 深度学习阶段:3-6个月(可选)

3.3.1 吴恩达深度学习课程

吴恩达的深度学习课程分为五个部分,通过Coursera平台发布。网易云课堂也提供了翻译版本。学习这些课程可以帮助你掌握深度学习的基础知识。

3.3.2 《深度学习》(Ian Goodfellow)

这本书由深度学习领域的几位权威人物撰写,内容全面且深入。建议根据自身需求选择阅读章节,例如基础数学知识、主流神经网络等。

4. 深入研究

完成上述计划后,你将具备一定的机器学习能力。接下来,重要的是形成系统的知识体系。可以考虑阅读《统计学习基础》等经典书籍,或关注顶级会议如ICML、NIPS、KDD等。此外,参与科研项目和企业实习也是非常有益的经验。

5. 结语

机器学习是当今最有前景的技术之一,欢迎各位读者尝试并享受这一领域的乐趣。无论选择哪个方向,保持独立思考的能力和去伪存真的勇气都是非常重要的。希望本文提供的路径能帮助你更好地规划自己的学习计划,最终实现自己的目标。

    本文来源:图灵汇
责任编辑: : 雷霞
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
何用入门机器基础学习
    下一篇