Python大数据机器学习高级工程师实战培训班
1. 课程概述
本课程涵盖了从基础到高级的机器学习算法和Python编程技能,通过理论与实践相结合的方式,帮助学员掌握大数据和机器学习的核心知识和应用技巧。
- 算法模块结构:每个模块按照“原理讲解→数据分析→动手操作→特征与调参”的顺序展开。
- Python数据清洗和特征提取:提升学习深度,降低学习难度。
- 网络爬虫:包括原理讲解和编写,注重实际成绩转化为实践模型的能力,分享实际案例和Kaggle竞赛案例。
- 强化数学知识:如矩阵运算、概率论、数理统计,掌握机器学习基础。
- 配套源码和数据:提供配套源码和数据,帮助理解和应用机器学习原理。
- 项目实践:强调项目实际,注重落地,提高在实际工作中选择算法的能力。
- 常用Python库:涵盖Numpy、Scipy、matplotlib、Pandas、scikit-learn、XGBoost、libSVM、LDA、Gensim、NLTK、HMMLearn等。
2. 课程目标
课程特点在于从数学层面推导经典机器学习算法,并通过实例和代码实现,教授算法参数调试,分析算法选择的实践案例。
3. 时间与地点
2019年10月28日至2019年10月31日
地点:北京
4. 咨询方式
如有疑问,请联系:
- 手机:13001051273
- 邮箱:798947682@qq.com
- 微信:TuyunAssistant
更多资讯可关注:
- 官方公众号:中科图云
- 服务号:中科图云AICloud
5. 培训对象
本课程面向大数据分析和机器学习领域的专业人士,包括但不限于:
- 大数据分析应用开发工程师
- 大数据分析项目的规划咨询管理人员
- IT项目高管人员
- 大数据分析与挖掘算法工程师
- 大数据分析集群运维工程师
- 售前和售后技术支持服务人员
6. 培训内容
模块一:机器学习的数学基础1 - 数学分析
- 机器学习的一般方法和横向比较
- 数学的重要性:以SVD为例
- 机器学习角度下的数学
- 复习数学分析
- 直观解释常数e
- 导数/梯度
- 随机梯度下降
- Taylor展式的实际应用
- Gini系数
- 凸函数
- Jensen不等式
- 组合数与信息熵的关系
模块二:机器学习的数学基础2 - 概率论与贝叶斯先验
- 概率论基础
- 古典概型
- 贝叶斯公式
- 先验分布/后验分布/共轭分布
- 常见概率分布
- 泊松分布和指数分布的物理意义
- 协方差矩阵和相关系数
- 独立和不相关
- 大数定律和中心极限定理的实际意义
- 最大似然估计和最大后验估计
- 过拟合的数学原理与处理方案
模块三:机器学习的数学基础3 - 矩阵和线性代数
- 线性代数的地位
- 马尔科夫模型
- 矩阵乘法的直观表达
- 状态转移矩阵
- 矩阵和向量组
- 特征向量的计算
- QR分解
- 对称阵、正交阵、正定阵
- 数据白化及其应用
- 向量对向量求导
- 标量对向量求导
- 标量对矩阵求导
模块四:Python基础1 - Python及其数学库
- Python解释器与IDE:Anaconda/Pycharm
- Python基础:列表/元组/字典/类/文件
- Taylor展式的代码实现
- numpy/scipy/matplotlib/pandas的应用
- 多元高斯分布
- 泊松分布和幂律分布
- 图像处理
- 蝴蝶效应
- 分形与可视化
模块五:Python基础2 - 机器学习库
- scikit-learn的应用
- 损失函数的绘制
- 多种数学曲线
- 多项式拟合
- 快速傅里叶变换
- 奇异值分解
- Sobel/Prewitt/Laplacian算子与卷积网络
- 卷积与移动平均线
- 股票数据分析
模块六:Python基础3 - 数据清洗和特征选择
- 算法和特征的关系
- 股票数据的特征提取和应用
- 异常检测和分析
- 缺失数据的处理
- 模糊数据查询和校正
- 朴素贝叶斯算法
- Naive Bayes分类器的应用
模块七至模块二十五:涵盖回归、决策树、随机森林、提升、SVM、聚类、EM算法、LDA、HMM等算法的学习与应用。
7. 师资介绍
张老师:阿里大数据高级专家,国内资深的Spark、Hadoop技术专家、虚拟化专家,拥有多年丰富的Hadoop生态系统技术研究和项目实施经验。
8. 证书颁发
参加培训并通过考试的学员,可获得由工业和信息化部颁发的《Python大数据工程师证书》,作为职业能力考核的证明。
9. 培训费用
7800元/人(含教材、培训费、考证费以及学习用具等费用),食宿统一安排,费用自理。请提前准备一寸彩照两张和身份证复印件一张。