图像识别技术：究竟能在商业世界掀起多大波澜？

张雨晗
2021-10-21 22:22:11 7

+关注

图像识别：商业世界的革命性角色

在当今时代，技术的发展对现代生活产生了深远的影响。然而，科技进步如此迅猛，我们往往难以跟上它的步伐。在这诸多技术进步中，图像识别无疑是最引人注目的技术之一。

什么是图像识别？

图像识别是计算机视觉的一部分，而计算机视觉则是人工智能的一个分支。计算机视觉使机器能够获取、处理和分析数据，主要通过视觉提示或其他传感器，如热传感器或超声波。这意味着机器能够“看”事物，甚至识别出人类无法察觉的内容。例如，卡内基梅隆大学的研究团队正在开发一种名为“呼吸凸轮”的应用，该应用通过四个云连接摄像头监控空气污染情况，甚至可以追溯污染源头。这正是图像识别的一种实际应用。

图像识别的核心功能在于让机器能够识别并标记物体和生物。TensorFlow是由Google开发的一个开源软件库，它定义了图像识别的过程：将图像或视频分解为像素，识别形状，从而理解图像内容并进行分类。例如，一个股票网站每天上传数百万张图片，使用图像识别技术，机器可以在图像传输到服务器后自动识别人物或物体，并生成详细的描述，从而提升搜索引擎的效果和用户体验。

如何实现图像识别？

目前，深度学习是最有可能让机器具备图像识别能力的技术。深度学习是一种模仿人类神经系统的机器学习框架，使计算机能够自主学习，而不需要人工编写指令。为了实现这一目标，机器需要大量的数据进行训练。全球范围内都在积极开发这样的数据集，其中最具代表性的就是ImageNet和PASCAL数据集。

ImageNet：由普林斯顿大学的研究人员于2009年创建，包含超过1400万张从Flickr等搜索引擎收集的图像。工作人员和志愿者对这些图像进行了详细标注，并将其分类为约1000个对象类别。
PASCAL：由欧盟国家的大学联合创建，包含20,000张训练图像，分为20个对象类别。尽管PASCAL的分类较为通用，但ImageNet则更注重识别不同类型的同一物体，例如“柯基犬”、“牧羊犬”和“哈巴狗”。

为何投资图像识别？

图像识别技术已经在各行各业得到广泛应用。例如，Qualcomm Connected Experiences公司在2012年推出的Vuforia软件平台，提供了丰富的AR和VR功能，使移动应用开发者能够扩展视野。Facebook也在2016年开始帮助盲人“看”照片，通过图像识别生成描述并朗读给用户听。

谷歌推出了Cloud AutoML，旨在简化AI在企业中的应用。该工具允许用户上传图像，训练系统识别图像。同样，迪士尼和Urban Outfitters等公司也利用图像识别技术改进网站搜索功能，使结果更符合用户需求。