带你少走弯路:五篇文章学完吴恩达机器学习
作者头像
  • 钟焰艳
  • 2019-11-07 12:56:27 8

本文是对吴恩达教授的《机器学习》课程笔记和代码复现部分的整理,这门课程是经典中的经典,但部分内容确实显得有些过时。

为了能在较短时间内高效地完成这门课程的学习,我推荐大家专注于课程的核心部分,这样能加快学习进度。

作者:黄海广

对于时间有限的朋友,可以按照以下五个关键章节的笔记和Python代码(原课程作业是Octave的,这里提供了Python复现版本)进行学习,快速掌握机器学习的基本概念,避免走不必要的弯路。建议将此文章收藏,利用碎片时间在手机上学习。

第一部分:回归

第二部分:逻辑回归

第三部分:支持向量机

第四部分:无监督学习

第五部分:异常检测与推荐系统

2014年12月,我在慕课网开始学习这门机器学习课程,课程内容非常丰富。我整理和翻译了大部分视频,并将这些视频字幕无偿分享给网易云课堂。目前有许多翻译版本,我的版本可能不是最好的,但却是下载量最多的。

如果你需要字幕和视频资料,可以在我的GitHub上下载。

在学习过程中,我将笔记放在了GitHub上供下载,这些笔记已被下载数十万次,并获得了超过13400个点赞。原课程的作业是用Octave编写的,但现在几乎不再使用。因此,我用Python 3.6复现了课程代码,并提供了笔记的Word和Markdown版本。虽然内容很多,但并不是所有部分都需要细读。作为笔记作者,我认为以下部分最为重要:回归、逻辑回归、支持向量机、无监督学习以及异常检测和推荐系统。这些部分不仅不过时,还包含了课程的核心精华。通过阅读这些内容和复现的代码,可以深入了解算法的核心思想。

希望各位能够高效学习,利用手机收藏本文,利用碎片时间完成“吴恩达机器学习课程”的学习。

原课程目录

第一周

1.1 引言

1.2 机器学习介绍

1.3 监督学习

1.4 无监督学习

2.1 单变量线性回归

2.2 代价函数

2.3 代价函数的直观理解

2.4 代价函数的直观理解II

2.5 梯度下降

2.6 梯度下降的直观理解

2.7 梯度下降应用于线性回归

2.8 接下来的内容

3.1 线性代数复习

3.2 矩阵和向量

3.3 矩阵和向量运算

3.4 矩阵乘法

3.5 矩阵乘法性质

3.6 矩阵逆与转置

第二周

4.1 多变量线性回归

4.2 多变量梯度下降

4.3 特征缩放

4.4 学习率

4.5 特征和多项式回归

4.6 正规方程

4.7 正规方程与不可逆性(选修)

5.1 Octave教程

5.2 Octave基本操作

5.3 数据处理

5.4 数据绘图

5.5 控制结构

5.6 向量化

5.7 编程练习

第三周

6.1 逻辑回归

6.2 假设表示

6.3 判别边界

6.4 代价函数

6.5 简化代价函数与梯度下降

6.6 高级优化

6.7 多类别分类

7.1 过拟合问题

7.2 代价函数

7.3 正则化线性回归

7.4 正则化逻辑回归

第四周

8.1 神经网络表示

8.2 神经元与大脑

8.3 模型表示I

8.4 模型表示II

8.5 样例与直观理解I

8.6 样例与直观理解II

8.7 多类别分类

第五周

9.1 成本函数

9.2 反向传播算法

9.3 反向传播算法的直观理解

9.4 参数展开

9.5 梯度检验

9.6 随机初始化

9.7 综合考虑

9.8 自动驾驶技术

第六周

10.1 决策下一步做什么

10.2 评估假设

10.3 模型选择与交叉验证

10.4 诊断偏差与方差

10.5 正则化与偏差/方差平衡

10.6 学习曲线

10.7 决策下一步做什么

11.1 项目规划

11.2 误差分析

11.3 类不平衡误差度量

11.4 查准率与查全率的权衡

11.5 机器学习数据处理

第七周

12.1 支持向量机

12.2 大间隔直觉

12.3 大间隔分类背后的数学(选修)

12.4 核函数I

12.5 核函数II

12.6 使用支持向量机

第八周

13.1 无监督学习简介

13.2 K均值算法

13.3 优化目标

13.4 随机初始化

13.5 聚类数目选择

14.1 数据压缩动机

14.2 数据可视化动机

14.3 主成分分析问题

14.4 主成分分析算法

14.5 主成分数量选择

14.6 数据压缩重构

14.7 主成分分析应用建议

第九周

15.1 异常检测动机

15.2 高斯分布

15.3 算法

15.4 异常检测系统构建与评估

15.5 异常检测与监督学习对比

15.6 特征选择

15.7 多元高斯分布(选修)

15.8 使用多元高斯分布进行异常检测(选修)

16.1 推荐系统问题形式化

16.2 基于内容的推荐系统

16.3 协同过滤

16.4 协同过滤算法

16.5 向量化:低秩矩阵分解

16.6 实践中的细节:均值归一化

第十周

17.1 大规模机器学习

17.2 随机梯度下降

17.3 小批量梯度下降

17.4 随机梯度下降收敛

17.5 在线学习

17.6 映射化简与数据并行

18.1 图像文字识别问题描述与流程图

18.2 滑动窗口

18.3 获取大量数据与人工数据

18.4 上限分析:改进流程

最后,我们来总结一下这门课程的内容,并感谢大家的支持。

参考资料

[1] 机器学习课程: https://www.coursera.org/course/ml

[2] 黄海广: https://github.com/fengdu78

[3] GitHub: https://github.com/fengdu78/Coursera-ML-AndrewNg-Notes

[4] 作业代码: https://github.com/fengdu78/Coursera-ML-AndrewNg-Notes/blob/master/code

[5] Markdown文件: https://github.com/fengdu78/Coursera-ML-AndrewNg-Notes/blob/master/markdown

[6] PDF文件: https://github.com/fengdu78/Coursera-ML-AndrewNg-Notes/blob/master/机器学习个人笔记残缺版v5.4-A4打印版.pdf

    本文来源:图灵汇
责任编辑: : 钟焰艳
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
走弯路机器学习文章吴恩达
    下一篇