厌倦了当前的工作,想要转行从事数据科学,但又缺乏计算机专业背景?不用担心,这里有一些方法可以帮助你入门数据科学领域。
这类问题在过去已经有不少解决方案。最近,一位名叫Dario的22岁数据科学家分享了他的自学经验,展示了如何从零开始学习数据科学。
对于那些能够自主学习在线课程和阅读书籍,但没有时间参加传统课堂教育的人来说,“从零开始自学”尤其适用。在正式开始学习之前,如果你对线性代数、微积分、概率论与统计学以及编程还不熟悉,建议先学习这些基础知识,然后再专注于Python。
完成基础课程后,你可以进一步学习。
选择看书还是看视频
要想进入数据科学领域,每天投入一到两个小时的学习时间是必要的。那么,你应该选择看书还是看视频呢?
很多人觉得在一天工作八小时之后再看书有些吃力,所以视频教程可能更适合你。此外,视频教程也可以在上下班途中观看。
Dario推荐了一门名为《数据科学与机器学习Python训练营》的课程,这门课是他初次接触数据科学时学习的。课程中使用了Pandas和NumPy进行数据分析,并利用Matplotlib和Seaborn进行数据可视化。尽管内容不算深奥,但足以让你入门数据科学。
此外,他还推荐了吴恩达教授在Coursera上开设的《机器学习》课程。这门课程大约需要十几个星期才能完成,全程用英语授课,但配有中文字幕。课程质量较高,受到了许多用户的青睐。
三本优秀的入门书籍
如果你更喜欢通过阅读书籍来学习,Dario也推荐了三本优秀的数据科学入门书籍。
第一本是《Python数据科学手册》。这本书从Jupyter Notebook入手,内容涵盖了NumPy、Pandas、Matplotlib和Scikit-Learn等数据科学的重要部分。中文版已于去年出版,获得了很高的评价,非常适合非计算机专业的读者。
第二本是《统计学习导论》。这本书的内容涉及一定的数学知识,但易于理解。它将机器学习这一广泛领域的知识浓缩在400页左右,唯一的小缺点是代码示例使用的语言是R而不是Python。不过,英文版提供了免费下载,中文版也已出版。
第三本是《Scikit-Learn与TensorFlow机器学习实用指南》。这本书能够帮助你深入了解机器学习的概念和算法。目前,该书的英文影印版和中文版均已上市。
下一步
完成所有课程后,Dario建议初学者创建一个GitHub项目,并寻找五个数据集进行实践。在这个过程中,你需要记录下自己的分析结论和思考过程。对于求职者而言,向潜在雇主展示你的工作非常重要。由于你没有相关的学位,展示你的数据科学项目将是一个很好的补充。
希望这些资源和建议对你有所帮助,祝你顺利进入数据科学领域!