AI的“眼睛”不好使

互联网金融动态
2022-12-12 14:23:24 3

区分一辆黄色出租车和一副双筒望远镜其实并不难，大多数人即使倒立也能轻松辨别。然而，对于人工智能（AI）而言，这样的任务却颇具挑战：即使将出租车翻转，AI也可能将其误认为双筒望远镜。

这是美国人工智能专家阮安搜集的众多案例之一，这些案例表明AI在物体识别方面的能力远低于我们的预期。这也使得人们在考虑AI应用于无人驾驶汽车等领域时更加审慎。

人类如何识别图像？图像识别是人工智能的重要研究领域。对于人类而言，识别图像并不是一件复杂的事情。我们通常依靠图像的特定特征来辨识它们。例如，字母A有一个尖端，P有一个圆圈，而Y的中心有一个锐角。研究表明，我们在识别图像时，往往聚焦于图像的主要特征，即那些轮廓曲度最大或方向突然改变的地方——这些区域包含最多的信息。如果图像具有多个特征，我们的眼睛会依次扫描这些特征。

因此，在识别图像的过程中，我们需要过滤掉多余的输入信息，只提取关键信息。然后将这些关键信息分类并存储在记忆中。下次再遇到类似的图像时，我们便能迅速提取其中的关键信息并与已存储的信息进行对比，从而识别出图像。这种机制不仅使我们能够识别特定的字母A，还能识别各种字体、方向不一甚至倒置的各种字母A。

AI为何会产生误判？然而，当前的AI图像识别技术尚未达到人类的水平。它们更多依赖于模式识别。所谓模式识别，就是识别某个图像必须在过去的经验中有相应的记忆模板。如果当前图像与记忆中的模板完全匹配，图像就能被识别。例如，一个字母A，如果在记忆中有对应的A模板，并且字母A的大小、方位和形状与模板完全一致，那么这个字母A就能被正确识别。这种方法强调图像必须与记忆中的模板完全吻合才能被识别。

正因为如此，AI常常会被人为修改过的图片误导。例如，给一只乌龟加上特殊外壳，人类仍然可以轻易辨认，但AI却可能将其误认为一把枪。然而，这种情况还算简单，因为这些图像往往是经过精心设计来迷惑AI的。更令人担忧的是，你几乎无需特意修改图像，就能让AI陷入混乱。

阮安和他的团队从一个训练AI的数据库中选取了一些常见物体的图像，然后随机旋转并改变物体在图片中的位置。他们发现，这样做足以难倒目前最先进的图像识别系统，这些系统在97%的情况下都会出错。例如，在一个案例中，原始图像是一辆校车，所有系统都能正确识别。但是，当图像被放大特写或倒置放置时，这些系统则将其误认为是一个口袋或铲雪机。

这是因为AI的图像识别能力是通过大数据训练得来的，但在训练过程中，物体很少被倒置或放大。因此，AI在处理这类特殊情况时显得力不从心。

如何让AI更接近人类？这种现状引发了关于使用AI的安全性的思考。例如，在战场或地震现场，我们希望图像识别系统能够在不同角度下准确识别物体。同样，基于AI的机场安检扫描仪也需要能够从多个角度识别行李中的物品。

对于无人驾驶汽车而言，这一问题尤为重要。车辆在遇到未知物体时只需避开即可，但如果将一个可乐罐误认为消防车而紧急刹车，则可能会引发危险。

遗憾的是，目前还没有人找到解决这些问题的方法。主要障碍在于，当AI看到一个图像时，它无法有效地提取关键信息，也无法分辨哪些信息是重要的，哪些是次要的。

因此，为了让AI达到人类的推理水平，我们需要赋予其从图像中提取关键信息的能力。

图灵汇

责任编辑：：互联网金融动态

声明：本文系图灵汇原创稿件，版权属图灵汇所有，未经授权不得转载，已经协议授权的媒体下载使用时须注明"稿件来源：图灵汇"，违者将依法追究责任。

好使眼睛

互联网金融动态

2022-12-17

申昊科技最新公告：取得一项发明专利证书 为一种图像识别动态纠偏方法

申昊科技最新公告：取得一项发明专利证书为一种图像识别动态纠偏方法