什么是机器学习
作者头像
  • 温煦
  • 2019-11-04 08:49:19 3

什么是机器学习?

机器学习是一种让计算机具备类似人类学习能力的技术,它通过分析大量的数据来提取有用信息,从而辅助决策。人类学习的过程通常包括观察大量实例、归纳总结、大胆假设、验证假设并得出规律,这一过程也被称为积累经验。当遇到新问题时,人们会根据已有的经验将其应用到新情况中,从而预测未来。

相比之下,机器学习的过程涉及收集与问题相关的大量历史数据,然后利用科学计算的方法挖掘数据中不同特征之间的关联关系。这样可以建立一个能够表示特征之间关系的模型。在遇到新问题时,只需将相关信息输入模型,就能预测未知属性。

在深入了解机器学习之前,先掌握一些基础知识将有助于更好地理解后续内容。这些基础知识包括:

  • 数据集:指用于训练和验证模型的所有数据集合。
  • 样本:数据集中描述某个事件或对象的每条记录。
  • 特征:描述事件或对象某方面特性的属性。
  • 属性值:特定属性的具体取值。
  • 属性空间:所有可能属性组合形成的空间。
  • 学习/训练:算法从历史数据中获取知识的过程。
  • 训练数据:用于训练模型的数据。
  • 标签:训练样本的结果信息。

机器学习的类型

有监督学习

在这种类型的学习中,训练数据包含明确的标签信息,用于指导模型学习。

无监督学习

在这种情况下,训练数据没有标签,模型需要自行发现数据中的结构和模式。

强化学习

这种学习方式与有监督学习类似,但没有标签指导。模型通过不断试错来自我评估和优化。

常用的机器学习方法

常见的机器学习方法多种多样,涵盖了从浅层到深层的各种算法和技术。

机器学习建模流程

机器学习是一种数据挖掘技术,其完整的建模流程可以概括为“跨行业标准的数据挖掘流程”。主要步骤包括:

1. 商业理解

从商业角度全面理解项目的需求和目标,并将其转化为数据挖掘的具体目标。关键任务包括确定商业目标、评估环境、定义数据挖掘目标以及制定项目计划。

2. 数据理解

评估数据的可用性和潜在价值,发现有价值的数据。关键步骤包括收集原始数据、描述数据、探索数据以及检查数据质量。

3. 数据准备

将原始数据处理成适合建模的形式。这个过程可能需要反复进行,是整个流程中非常关键且耗时的一个环节。主要工作包括特征选择、数据清洗、数据预处理、数据转换和特征工程。

4. 数据建模

使用机器学习模型进行建模,并调整参数以优化性能。主要任务包括选择建模技术、设计测试方案、构建模型以及评估模型。

5. 模型评估

通过训练获得高质量模型后,在实际部署前进行全面评估,确保模型达到预期的商业目标并有改进空间。

6. 部署

完成建模后,将模型应用于实际场景,并规划后续监控和维护工作。

以上是对机器学习的基础介绍,掌握这些基础知识后,我们可以更好地规划数据挖掘和机器学习建模的整体策略。

    本文来源:图灵汇
责任编辑: : 温煦
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
机器学习什么
    下一篇