马住!谷歌机器学习主管“十年自学编程”的三个心得体会
作者头像
  • AI科技评论
  • 2019-12-09 17:06:34 0

数据科学、机器学习和分析领域被认为是当前非常热门的职业之一。工业界、学术界和政府部门都急需具备数据科学技能的专业人士,这促使越来越多来自不同背景的专业人士投身其中,如物理学、数学、统计学、经济学和工程学等。数据科学家的就业前景非常乐观。据IBM预测,到2020年,对数据科学家的需求将增加28%。

数据科学是一个广泛且复杂的领域,涵盖了数据准备与探索、数据展示与转换、数据可视化、预测分析及机器学习等多个方面。对于希望入门数据科学的初学者,可能会遇到一些常见问题:

  1. 学习数据科学需要多长时间?
  2. 有哪些学习资源可以帮助入门数据科学?

这里提到的问题部分源于彼得·诺维格的观点,他认为成为编程专家需要花费时间、耐心和承诺。建议读者可以阅读彼得·诺维格的《十年自学编程》,以获得更深刻的见解。虽然不需要花十年的时间来掌握数据科学的基础知识,但急于求成并不会有所帮助。成为一名合格的数据科学家需要时间、努力、专注和奉献精神。

笔者通过两年的自学,深入掌握了数据科学的基础知识。这得益于笔者在物理学领域的深厚背景和扎实的数学及编程能力。掌握数据科学所需的时间因人而异,但通常在数学、统计学、计算机科学、工程学或经济学等领域有扎实基础的人会更有优势。

彼得·诺维格的“十年自学编程”理念有以下几点启示:

  • 掌握数据科学需要时间和耐心,不要相信那些声称可以在几周内掌握数据科学的宣传。

为了更好地掌握数据科学的基础知识,下面列举了一些有用的资源:

  1. 哈佛大学提供的数据科学专业证书:通过edX平台提供,涵盖多个课程,全部使用R语言教学。

  2. 佐治亚理工学院提供的分析学基础工具和方法:同样通过edX平台提供,涵盖多种语言如R、Python和SQL。

  3. 密歇根大学提供的Python在数据科学中的应用:通过Coursera平台提供,大部分课程可以免费试听,部分课程需要付费获取认证。

  4. 数据科学教科书:从教科书中学习的知识往往更为系统和深入。推荐《Python机器学习》一书,它以清晰易懂的方式介绍了机器学习的基本概念,并提供了相应的代码实例。

除了以上资源,与其他数据科学爱好者建立联系也是非常重要的。通过参与小组讨论、在GitHub上分享代码、在LinkedIn上展示自己的技能,可以更快地掌握新概念和工具,并接触新的算法和技术。

数据科学是一门高度依赖数学的学科,需要掌握统计学、概率论、多元微积分、线性代数和优化理论等知识。尽管像scikit-learn和Caret这样的库提供了许多数据科学和机器学习模型构建工具,但了解这些工具背后的原理同样重要。

避免将机器学习模型视为黑箱工具。理解模型的所有细节,包括不同超参数的作用及其调整方法,是构建高效模型的关键。盲目使用模型而不了解其内部机制会导致错误的结果。

总之,数据科学是当前非常热门的领域之一。随着数字化进程的加快,公司和政府每天都会产生大量数据,对高水平数据科学家的需求也在不断增加。现在是掌握数据科学基础知识的最佳时机。记住,不要急于求成,投入适当的时间和精力,逐步掌握数据科学的基础知识。

    本文来源:图灵汇
责任编辑: : AI科技评论
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
心得体会自学主管机器三个编程学习谷歌马住!
    下一篇