最粗浅的机器学习引见
作者头像
  • 2020-06-26 07:30:43 7

摘要

本文旨在阐述数据分析与机器学习的关系,并澄清一些关于机器学习的误解。此外,本文还将详细介绍机器学习的工作原理及其不同类型。

即使你并非人工智能专家,也无需担心。本文不会涉及复杂的概念如线性回归或k-均值聚类。

数据分析与机器学习

许多人误以为大数据只是关于SQL查询和大量数据的集合,然而其核心在于通过对数据的洞察,从中提取价值和有用信息。例如,通过降低5%的价格,可能会增加10%的销量。

数据分析是一项重要的技术,主要包含以下几个方面:

  • 描述性分析:确定已发生的情况。通常涉及报告数据的现象,如比较本月销售额与去年同期。

  • 特征性分析:解释现象发生的原因。这通常需要使用带有OLAP技术的控制台来分析和研究数据,并借助数据挖掘技术找出数据间的关联。

  • 预测性分析:评估可能发生的事情的概率。例如,根据个人兴趣和职业特点,预测谁可能是潜在读者。

机器学习特别适用于预测性分析。

什么是机器学习

机器学习是人工智能的一部分,其目标是使机器能够基于以往的经验学习。与传统编程不同,机器学习解决方案可以通过数据来适应和优化输出结果,而不需要显式地编写代码。

机器学习算法通过数据训练构建一个反映现实世界的计算机模型。例如,垃圾邮件过滤器利用机器学习技术从数百万封邮件中识别垃圾邮件,采用统计方法进行判断。

机器学习的应用实例

机器学习广泛应用于多个领域,例如:

  • 目标影响:个性化广告,如Google和Facebook的目标广告,以及Netflix的电影推荐和亚马逊的商品推荐;

  • 信用评分:银行利用支出数据和其他个人信息来预测贷款违约的可能性;

  • 信用卡欺诈检测:根据用户的消费习惯在线识别欺诈行为;

  • 购物篮分析:根据大量消费者的购买习惯预测他们可能感兴趣的特定优惠。

尽管机器学习带来了许多好处,但也存在一些争议。例如,一家零售商通过分析顾客的购物篮成功预测了女性怀孕,但这一做法有时可能导致不良后果。

你需要什么

要有效地进行机器学习,你需要以下几点:

  • 目标:明确你希望解决的问题,例如信用卡盗刷、股票价格波动或用户最喜欢的电影;

  • 大量数据:准确预测房屋价格需要详细的房价历史记录;

  • 专家:需要领域内的专家来验证结果并确认何时模型足够准确;

  • 模式:寻找数据中的模式,没有模式可能意味着数据不完整或错误。

机器学习的类型

机器学习主要有三种类型:

  • 监督学习:当已知过去数据的正确答案时,用于预测未来结果。例如,利用历史房价预测当前和未来的房价。这种方法依赖于统计方法的逐步改进。

  • 无监督学习:当没有明确的正确答案时,用于探索数据的新发现。例如,在Spotify上对音乐进行分类,帮助推荐用户可能喜欢的歌曲。

  • 强化学习:不需要明确的答案,而是通过不断接近目标来优化算法。这种技术常用于神经网络,例如AlphaGo通过自我对弈成为围棋世界冠军。

机器学习的过程

机器学习过程通常涉及以下步骤:

  • 定义问题:明确你要解决的问题和目标;

  • 收集数据:高质量的数据对于提高模型准确性至关重要;

  • 准备数据:清理和解析数据,删除或纠正异常值,将数据分为训练数据和测试数据;

  • 训练模型:使用训练数据识别模式或进行预测,并通过反复测试和误差修正逐步提高模型精度;

  • 评估模型:使用测试数据集评估模型的准确性,避免使用训练数据进行评估;

  • 部署和改进:尝试不同的算法或收集更多种类和数量的数据,以进一步提高模型性能。

总的来说,机器学习是一个持续迭代和改进的过程,因为数据和环境总是在变化。

总结

机器学习的核心在于数据,而算法、编程技巧和数据质量则是成功的关键因素。通过不断优化这些要素,机器学习将在各个领域发挥更大的作用。

    本文来源:图灵汇
责任编辑: :
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
引见粗浅机器学习
    下一篇