人工智能正在逐步渗透到各个工业领域,成为媒体关注的焦点。Rub神经计算研究所的研究团队已经研究了25年之久,他们始终坚持的原则是:为了使机器真正智能化,必须首先让机器学习更加高效和灵活。
研究所主席劳伦斯·维斯科特教授解释说,如今有两种成功的机器学习类型:深度神经网络(又称深度学习)和强化学习。深度神经网络能够做出复杂决策,常用于图像识别。例如,它们可以从照片中区分性别。
这些网络的设计灵感来源于大脑中的神经细胞或神经元网络。神经元通过多个输入通道接收信号,然后决定是否以电信号的形式传递给下一个神经元。同样的,神经网络也会接收多个输入信号,如像素。在初始阶段,许多人工神经元通过简单的数学运算,如将输入信号乘以不同的固定权重并相加,来处理多个输入信号。每一个运算都会产生一个值,这个值有助于做出决策。例如,在判断性别时,负结果会被设为零,以微调决策。
这一过程会在后续阶段重复进行,直至网络做出最终决策。随着网络层次的增加,其功能也会变得更加强大。具有超过100层的神经网络并不少见。神经网络在某些识别任务上的表现往往优于人类。这种网络的训练依赖于正确选择权重因子,而这些因子最初是随机设定的。为了训练网络,输入信号和最终决策需要从一开始就明确指定,从而使网络能够逐步调整权重因子,以最大化正确决策的概率。
另一方面,强化学习受到心理学的启发。在这种学习模式中,算法的每一次决策都会带来奖励或惩罚。例如,假设在一个网格上有一个代理人,它的目标是最短路径到达左上角。一开始,代理人可能会盲目行动,每一步不达标都会受到惩罚。只有朝着目标前进的步骤才会得到奖励。
通过无数次尝试,代理人会逐渐学会如何快速达到目标。为了实现这一目标,代理人会对每个位置进行评分,以确定离目标的距离。随着经验的积累,这些评分会越来越准确。这种学习过程的基础技术可以追溯到20世纪80年代,但如今的成功主要归功于更强的计算能力和更多可用的数据。为了训练神经网络,可能需要多次运行低效的学习过程,并提供大量图像和描述。
维斯科特教授指出,关键问题是:如何使训练过程更加高效和灵活?尽管人工智能在特定任务上可能超越人类,但它难以将知识推广或应用到相关任务上。因此,研究团队致力于开发新策略,使机器能够自主发现结构。其中一个策略是无监督学习,这种方法不依赖于期望结果或奖励/惩罚机制,而是依赖于输入数据本身。
例如,任务可以是将相似数据分组。对于三维空间中的点,这意味着将距离较近的点归为一类。以人脸为例,分组后,人们可能会发现计算机已经将一组男性照片和一组女性照片分别归类。这种方法的一个优势是,只需提供照片作为输入,而无需复杂的训练数据说明。
此外,研究团队还探索了另一种方法,即慢速学习。这种方法利用缓慢变化的视频来提取特征,以构建环境的抽象表示。这种方法的重点在于预先处理输入数据,从而提高模型的灵活性和准确性。
总之,研究人员承认,增加灵活性可能会牺牲部分性能。但从长远来看,为了开发能够适应新情境的机器人,灵活性是不可或缺的。