什么是机器学习?
作者头像
  • 罗瑄
  • 2024-01-08 17:47:01 6

物联网的一个重要议题是如何生成和利用数据。为了发现数据之间的关系和规律,我们需要借助专业的工具和特定的算法,从而挖掘出新的商业价值和数据价值。这自然引出了机器学习(ML)这一主题。

机器学习、深度学习和人工神经网络是大数据和物联网领域常见的术语。当前,机器学习已成为物联网的核心部分。智能设备收集的数据需要经过分析,才能进行智能化的操作和判断。然而,手动处理这些数据既耗时又低效,因此,机器能够快速处理信息并在特定条件下做出及时反应。例如,在智能驾驶中,视觉智能系统可以通过识别不同路况的情况来判断汽车所处的环境,并作出正确的决策。不过,机器学习并不是新鲜事物,它早在20世纪80年代就已经出现。

机器学习概述

实际上,机器学习是人工智能(AI)的一部分。人工智能涵盖了所有能够模仿人类智力行为的技术,从高度复杂的逻辑技术到简单的if-then-else决策循环。在复杂的情况下,静态规则难以直接应用于程序中,因为这些数据的变化很快且缺乏规律性。例如,在计算机上进行汉字拼写检查时,虽然程序可以识别单个字的发音,但无法识别词组和词义。这时就需要通过机器学习来解决这一问题。机器学习关注的是计算机在接受数据后如何给出最佳解决方案。这一领域非常广泛,目前主要分为两类:监督学习和无监督学习。

监督学习

在监督学习中,需要将已知正确答案的数据输入到训练程序中。例如,训练一个系统识别火车轨道上是否存在障碍物。通过摄像头和传感器捕捉物体形状,并通过数据反馈给计算机系统,系统可以判断该物体是人、动物还是其他东西。使用监督学习技术,可以为成千上万的物体贴上标签,形成训练集。算法通过分析不同标签之间的差异,计算出偏差,以确定新图像是否与已有标签的物体相似。这一过程被称为分类。

经过训练后,机器能够轻松识别物体,并可以在实际应用中进行验证。如果验证结果不符合预期,还需要进一步的训练。

无监督学习

在某些情况下,监督学习并非是最优选择。例如,在大批量设备中检测设备偏差时,采用人工方式过于不切实际。此时,可以利用机器记录数据,使数据之间形成关联。然后对这些数据进行分组并找出平均值,使用函数进行分析。在设备“好”与“坏”的区分中,由于没有预先设定的答案,需要手动评估结果以确保准确性。这是一个群体行为的变化,计算机可以从中学到不同的知识。当然,温度监控是一个相对简单的例子。大多数情况下,参数是多维的。下图展示了这种分组和偏差检测的逻辑示例,展示了三个参数并发现四组不同的组合。

神经网络

处理多维度数据需要大量的计算能力,因为很难确定输入参数及其组合。监督学习需要大量的人力进行分类,这使得神经网络逐渐替代了监督学习,因为它训练机器的成本较高。直到21世纪,计算机硬件技术快速发展,计算性能变得更为经济,这使得神经网络进入了大众视野。与此同时,算法效率也取得了显著进步。

以购物网站的推荐算法为例,用户在浏览商品时会留下行为数据。这些数据通过算法分析得出用户的年龄区间、职业、性别、兴趣等信息,形成用户画像并存储到数据库中。之后,通过这个画像向用户推荐商品,帮助他们找到满意的产品。这就是神经网络算法的应用场景之一。它的原理类似于人脑的工作方式。当看到另一个人时,大脑会给这个人贴上各种标签,并随着接触的深入不断更新这些标签,最终形成对该人的全面认知,并据此做出判断。

神经网络之所以高效,是因为每个单元处理简单的问题,速度快。例如,视觉神经网络可以根据面部特征来区分不同的动物。神经网络依赖于权重思想,即将信息分成若干关键部分,对每组组成部分进行权重分配。权重越高,表示相似度越高。例如,“没有明显的直线+脸+微笑=人类”这种组合权重较高。

当一层的结果被传递到另一层时,这一过程被称为深度学习。深度学习的优势在于它有更多的判断标准,并且结果更贴近现实。每一层的数据都可以被格式化,以便在传递到下一层时更加精确。

    本文来源:图灵汇
责任编辑: : 罗瑄
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
机器学习什么
    下一篇