AI的“眼睛”不好使
作者头像
  • 互联网金融动态
  • 2022-12-12 14:23:24 3

区分一辆黄色出租车和一副双筒望远镜其实并不难,大多数人即使倒立也能轻松辨别。然而,对于人工智能(AI)而言,这样的任务却颇具挑战:即使将出租车翻转,AI也可能将其误认为双筒望远镜。

这是美国人工智能专家阮安搜集的众多案例之一,这些案例表明AI在物体识别方面的能力远低于我们的预期。这也使得人们在考虑AI应用于无人驾驶汽车等领域时更加审慎。

人类如何识别图像? 图像识别是人工智能的重要研究领域。对于人类而言,识别图像并不是一件复杂的事情。我们通常依靠图像的特定特征来辨识它们。例如,字母A有一个尖端,P有一个圆圈,而Y的中心有一个锐角。研究表明,我们在识别图像时,往往聚焦于图像的主要特征,即那些轮廓曲度最大或方向突然改变的地方——这些区域包含最多的信息。如果图像具有多个特征,我们的眼睛会依次扫描这些特征。

因此,在识别图像的过程中,我们需要过滤掉多余的输入信息,只提取关键信息。然后将这些关键信息分类并存储在记忆中。下次再遇到类似的图像时,我们便能迅速提取其中的关键信息并与已存储的信息进行对比,从而识别出图像。这种机制不仅使我们能够识别特定的字母A,还能识别各种字体、方向不一甚至倒置的各种字母A。

AI为何会产生误判? 然而,当前的AI图像识别技术尚未达到人类的水平。它们更多依赖于模式识别。所谓模式识别,就是识别某个图像必须在过去的经验中有相应的记忆模板。如果当前图像与记忆中的模板完全匹配,图像就能被识别。例如,一个字母A,如果在记忆中有对应的A模板,并且字母A的大小、方位和形状与模板完全一致,那么这个字母A就能被正确识别。这种方法强调图像必须与记忆中的模板完全吻合才能被识别。

正因为如此,AI常常会被人为修改过的图片误导。例如,给一只乌龟加上特殊外壳,人类仍然可以轻易辨认,但AI却可能将其误认为一把枪。然而,这种情况还算简单,因为这些图像往往是经过精心设计来迷惑AI的。更令人担忧的是,你几乎无需特意修改图像,就能让AI陷入混乱。

阮安和他的团队从一个训练AI的数据库中选取了一些常见物体的图像,然后随机旋转并改变物体在图片中的位置。他们发现,这样做足以难倒目前最先进的图像识别系统,这些系统在97%的情况下都会出错。例如,在一个案例中,原始图像是一辆校车,所有系统都能正确识别。但是,当图像被放大特写或倒置放置时,这些系统则将其误认为是一个口袋或铲雪机。

这是因为AI的图像识别能力是通过大数据训练得来的,但在训练过程中,物体很少被倒置或放大。因此,AI在处理这类特殊情况时显得力不从心。

如何让AI更接近人类? 这种现状引发了关于使用AI的安全性的思考。例如,在战场或地震现场,我们希望图像识别系统能够在不同角度下准确识别物体。同样,基于AI的机场安检扫描仪也需要能够从多个角度识别行李中的物品。

对于无人驾驶汽车而言,这一问题尤为重要。车辆在遇到未知物体时只需避开即可,但如果将一个可乐罐误认为消防车而紧急刹车,则可能会引发危险。

遗憾的是,目前还没有人找到解决这些问题的方法。主要障碍在于,当AI看到一个图像时,它无法有效地提取关键信息,也无法分辨哪些信息是重要的,哪些是次要的。

因此,为了让AI达到人类的推理水平,我们需要赋予其从图像中提取关键信息的能力。

    本文来源:图灵汇
责任编辑: : 互联网金融动态
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
好使眼睛
    下一篇