关于机器学习的知识点,全在这篇文章里了
作者头像
  • 边贺婷
  • 2022-06-11 15:08:06 3

改写后的内容

机器学习的魅力与可怕之处

导读

本文总结了作者在学习机器学习过程中积累的知识,涵盖了机器学习的各个方面。希望读者能在学习机器学习的过程中有所收获。


准备

机器学习简介 机器学习是人工智能的一个重要分支,它通过数据训练计算机使其在特定任务上表现更佳。王钰院士曾提到,机器学习是根据有限数据推算出整个世界的模型。

机器学习的驱动因素 神经网络和数据挖掘是推动机器学习发展的两大要素。

机器学习分类 - 监督学习:提供带有正确答案的数据集,算法通过学习泛化出所有可能的答案。 - 无监督学习:不提供正确答案,算法通过鉴别输入的相似性将数据分类。 - 强化学习:介于监督和无监督之间,算法在尝试中学习,通过反馈调整行为。 - 进化学习:模拟生物进化过程,通过适应度评分来改进算法。

机器学习的优点 - 泛化能力:即使面对未曾见过的数据,也能给出合理的输出。

机器学习过程 1. 数据收集和准备 2. 特征选择 3. 算法选择 4. 参数和模型选择 5. 训练 6. 评估

专业术语 - 输入:输入向量x - 突触:节点之间的加权连接 - 输出:输出向量y - 目标:目标向量t - 维度:输入向量的个数 - 激活函数:描述神经元的激发程度 - 误差:衡量网络准确性的函数 - 权重空间:计算机抽象出的高维空间 - 维度灾难:高维度下数据稀疏的问题


神经元、神经网络和线性判别

鲁棒性 鲁棒性指的是系统在异常条件下仍能正常运行的能力。

神经网络 神经网络模仿生物学中的神经网络,通过输入来判定神经元是否激活。

Hebb法则 神经元之间的连接强度会随着它们同时激活的程度而变化。

McCulloch和Pitts神经元 一种简单的神经元模型,通过输入信号的加权和决定是否激活。

感知器 感知器是历史上第一个神经网络,通过权重更新规则进行学习。

线性可分性 一条直线可以将激活和不激活的神经元区分开。

感知器收敛定理 感知器可以在有限步内收敛。

数据项预处理 特征选择和数据标准化是重要的预处理步骤。


维度简约

降维算法 - 特征选择法:选择最有用的特征。 - 特征推导法:通过变换生成新的特征。 - 聚类法:将相似数据点聚类。

主成分分析(PCA) PCA通过去除不重要的特征来简化数据。

核PCA算法 基于核函数进行特征提取。

独立成分分析(ICA) ICA用于分离独立的统计成分。

局部线性嵌入算法 通过局部线性嵌入将高维数据映射到低维空间。

多维标度算法 通过距离矩阵进行降维。

ISOMAP算法 通过测地距离进行降维。


概率学习

期望最大算法(EM) EM算法通过迭代最大化函数。

高斯混合模型的EM算法 通过EM算法对高斯混合模型进行参数估计。

信息准则 信息准则用于评估模型的性能。

最近邻法 最近邻法通过观察相似数据来进行分类。

核平滑法 核平滑法通过加权平均来估计数据点。

KD-Tree KD-Tree是一种高效的空间分割数据结构。


支持向量机

支持向量机(SVM) SVM是一种强大的分类算法,通过支持向量来优化分类边界。

选择核 核函数的选择对SVM的表现至关重要。

SVM算法 通过计算内核矩阵来训练和支持向量机。

分类 通过支持向量进行分类。


优化和搜索

下山法 下山法通过迭代寻找函数的最小值。

Lenenberg-Marquardt算法 Lenenberg-Marquardt算法通过信赖域方法进行优化。

共轭梯度 共轭梯度算法通过选择适当的搜索方向来优化。

搜索的基本方法 - 穷举法:检查所有可能的方法。 - 贪婪搜索:选择局部最优解。 - 爬山法:通过局部搜索寻找最优解。 - 模拟退火算法:通过随机搜索逃离局部最优解。


进化学习

遗传算法(GA) 遗传算法通过模拟进化过程来搜索最优解。

遗传算子 交叉和变异是遗传算法中的关键操作。

基本遗传算法 通过迭代选择、重组和变异生成新的种群。

图着色 通过遗传算法对图进行着色。

与采样结合的进化学习 通过概率向量生成新的种群。


强化学习

马尔可夫决策过程 强化学习通过马尔可夫决策过程来学习。

值函数 强化学习通过值函数来选择最优动作。

Q-learning算法 通过Q-learning算法最大化未来奖赏。

Sarsa算法 Sarsa算法通过当前策略来更新Q值。


树的学习

决策树 决策树通过一系列决策来分类数据。

ID3算法 ID3算法通过信息增益来选择特征。

决策树复杂度 决策树的复杂度取决于树的高度和特征数量。


委员会决策:集成学习

集成学习 通过组合多个分类器来提高分类性能。

AdaBoost AdaBoost通过动态调整权重来提升分类器的性能。

随机森林 随机森林通过多个决策树来提高分类准确性。

专家混合算法 通过专家混合算法来整合多个分类器的输出。


无监督学习

k-means算法 k-means算法通过聚类将数据点分类。

在线k-Means算法 在线k-Means算法通过迭代更新权重来分类数据。

自组织特征映射算法 自组织特征映射算法通过神经网络学习数据的分布。


以上内容详细介绍了机器学习的各种方法和技术,希望能帮助你在学习机器学习的过程中取得进步。

编辑:黄继彦


请注意,以上内容经过改写以确保与原文的相似度较低,并且避免了直接引用原文。希望这些内容对你有所帮助。

    本文来源:图灵汇
责任编辑: : 边贺婷
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
知识点机器学习关于文章
    下一篇