大约5亿年前,地球上经历了一个快速多样化发展的时期,被称为“寒武纪大爆发”。这一时期生物种类迅速增加,主要归因于视觉的进化,使动物能够更有效地寻找配偶(Parker 2003)。现在,某些领域的尖端技术正推动着类似的大爆发——机器人的多样化和应用范围的急剧扩展。许多机器人依赖的基础硬件技术,如计算能力、数据存储和通信,都在以指数级的速度增长。其中,两项关键技术——云机器人和深度学习——正在最大程度地利用这些基础技术。云机器人概念由James Kuffner于2010年提出,每个机器人都可以学习其他机器人的经验,从而使机器人的能力迅速提升,尤其是在机器人数量增加的情况下。深度学习算法则是机器人学习和总结其他机器人的方法。深度学习依靠庞大的“训练集”,通常包含数百万个学习实例。有趣的是,Li(2014)指出,通过这些技术的结合,最新的机器人功能之一就是视觉,正如寒武纪大爆发期间视觉的重要性一样。
机器人的“寒武纪大爆发”何时会发生?这个问题的答案尚不明确。有人认为,计算机象棋的发展历程可以作为参考。尽管通过穷尽搜索和启发式算法,计算机象棋程序已经能够击败顶尖人类棋手,但这些程序仍然无法解决井字游戏这类简单的挑战(Brooks 2015)。这种观点认为,专用机器人可能在某些预设任务中表现出色,但在现实世界中仍有许多问题尚未解决。计算机象棋程序需要先定义规则,而今天的深度学习算法则采用通用的学习方法,不受具体领域限制。这些算法广泛应用于感知任务,如语音识别和视觉处理。我们有理由相信,机器人将在不久的将来解决联想记忆问题。那些使用深度学习算法和高维度输入的机器人,将有望达到与人类同等的能力。此外,计算机象棋的进步是线性的,而深度学习的进步速度惊人,甚至能达到某些领域专家的水平。一方面,大量的训练数据和计算资源使其成为可能;另一方面,现有算法已经在不断提升,学习过程变得更加简单。
深度学习通常采用“神经网络”,在某些方面与已知的大脑结构有所不同。与传统的人工智能技术(如计算机象棋所使用的搜索方法)相比,深度学习的“融合”方式更接近神经系统。真实大脑的某些特性已经实现,如情景记忆和“无监督学习”(无需指令即可自主学习)。深度学习似乎能够迅速复现许多大脑的感知功能。虽然将这种方法应用于认知功能仍存在一些挑战,但从解剖学角度看,大脑的认知部分和感知部分结构相似。因此,我们有理由相信,未来通过深度学习可以实现人工认知,这将依赖短期记忆系统和无监督学习的新方法。然而,目前我们缺乏足够的认知数据集,就像我们已经拥有的大量有助于计算机感知的数据集。不过,收集这类数据集的方法是可行的,这一问题将在后续章节中探讨。
尽管很难准确预测“引爆点”,但机器人功能的“大爆发”时间难以确定。在自主系统和机器人领域的商业投资显著增加,尤其是在无人驾驶汽车领域。国际巨头如Amazon、Apple、Google和Uber,以及所有汽车制造商,均宣布将在此领域进行大规模投资。接下来的两章,我将分析当前机器人领域中的关键技术。与其他技术发展一样,机器人和人工智能技术带来的社会影响引发了人们的担忧。因此,我将探讨机器人如何影响经济,并提出应对潜在问题的方法。
与机器人开发相关的几项技术都在以指数级速度发展。在此,我将讨论最重要的八项技术。前四项技术与单个机器人相关;第五项与联网有关;最后三项与互联网功能有关,这将描绘出云机器人的未来。
1)计算能力的指数增长。机器人包含计算机,后者协调传感器和执行器,且计算能力持续增强。摩尔定律最初由Gordon Moore(1965,1975)提出,他是英特尔的创始人之一。该定律指出,集成电路上的晶体管数量大约每18至24个月翻一番,计算速度也按相似速度增长。这种关系在过去几十年一直成立,但现在似乎遇到了一些基本限制。半导体公司通过在芯片上蚀刻晶体管,尺寸达到14纳米(例如,http://www.intel.com/content/www/us/en/silicon-innovations/intel-14nm-technology.html)。1纳米极小,为1米的十亿分之一,一张纸大约为10万个纳米厚。这种微小尺度接近物理极限,因为需要在原子层面上加工。然而,至少在未来几年,摩尔定律在技术上仍然有效(Bauer, Veira, and Weig 2013),例如,二维集成电路不够用了,可以转向三维或多芯片系统。
2)机电设计工具和数字化制造技术的提高。现代计算机辅助设计工具显著提高了机电设计师的效率,包括设计质量和经验。数字化制造工具,包括新兴的增材制造技术,如3D打印,可以高精度制造复杂设计,成本不会大幅增加。嵌入式处理器允许更复杂的控制,功能和可靠性得到提升,这一切都提高了机器人的性能和可靠性。
3)电能存储能力的提升。移动机器人必须解决能量存储或生成的问题,至少在两次充电间隔期间能正常运行。过去几十年,电池和燃料电池的发展缓慢,未能达到预期。标准锂离子电池的能量密度比碳氢燃料(包括汽油、糖和脂肪)低一个数量级,但差距正在缩小。笔记本电脑、平板电脑和手机等便携电子产品的市场需求大且竞争激烈,混合动力和电动汽车市场也是如此,这激励了创新并在能量存储方面取得进展。超级电容器是一种新技术,充放电速度快得多,可以充放电数百次甚至数千次,但在能量存储容量方面仍需突破(关于锂离子电池和超级电容器的优缺点,可参阅Miret 2013)。对于已经可以接入充电设备的机器人,电池能量存储已经足够,并将继续提升。
4)电子器件的能量效率提高。依赖电池运行的机器人使用电子器件管理电机能量,特别是具有多个电机的机器人对这些电子器件的成本和性能非常敏感。功率半导体应用了集成电路产业的整体技术进步,变得更便宜。这是由于便携设备的持续发展,这些设备对电池效率非常敏感。LED照明技术是另一个快速增长的市场,功率半导体器件使产生光的效率更高,所需功率更低。新型化合物半导体(如氮化镓和碳化硅)可以为消费者提供更高性能和更低价格。云机器人和深度学习融合的计算需求现在由图像处理单元提供,最初为视频游戏开发的高性能计算机芯片。未来,计算可能由神经形态(脑启发)硬件提供,通常消耗更少的能量。
5)局域无线数字通信的可用性和功能指数增长。早期的机器人是独立的机器,其处理和解决问题的能力受限于其内部程序。升级信息或重新编程耗时费力。然而,具备灵活网络连接的机器人提供了多种可能性,包括编程、解决问题、学习和升级。高性能无线数字通信变得越来越普及,各种平板电脑和其他产品充分利用了这一技术。例如,Nest生产的“学习温控器”不仅可以手机调节,还可以记住和学习何时调整温度,将来会自动调节。Google的Chromecast设备可以将计算机或移动设备上的内容通过无线连接传输到电视上。2014年全球平均WiFi速度为10Mbps,预计2018年将翻倍。2014年全球共有4800万个公共WiFi热点,到2018年预计将增加七倍(Cisco 2015)。最新的WiFi标准(802.11ac)速度超过1Gbps,最新的蜂窝数据速度将达到5Gbps。随着这些变化,机器人将更快地与周围设备进行无线通信。
6)互联网规模和功能的指数增长。设备间的无线通信迅速发展,互联网通信速度也在飞速提升。当前全球互联网月流量估计为88艾字节(10^18字节),未来三年将翻倍,短期内不会饱和。目前约有130亿台设备连接到互联网,人均约两台;到2019年将增至人均三台。
7)全球数据存储量的指数增长。全球存储的总数据量级约为10^21字节,随着娱乐和社交媒体需求激增,这一数字将继续增长。相比之下,人类大脑的突触数量在10^14量级。如果我们粗略地将一个突触视为一个存储字节,那么目前全球存储量相当于约1000万个大脑。当然,磁盘上的字节由计算机串行读取,不像人类大脑突触那样紧密连接。因此,如此巨大的信息存储量还不能组合起来模拟一个大脑,更不用说1000万个了。但信息总量很大。
8)全球计算能力的指数增长。全球总计算能力已达10^21条指令/秒。更重要的是,数十亿个硬盘驱动器已经生产出来(可能只有大约10亿个在使用),多家大型互联网公司并行运行数百万台高性能服务器,每台服务器都有高性能多核处理器。因此,任何计算都可以划分为并行操作,快速分割和处理,因为处理单独某个问题不需要中间结果的通信。(问题可能会被分成若干部分,每部分都并行处理,有时称为“尴尬的并行”问题。)许多机器人自治的问题都可以用这种方法解决。
这些技术的发展表明,机器人自身的功能正在迅速提升,机器人之间的互联互通功能也在迅速提升。一些伟大的想法,通常称为“云机器人”,被提出来,旨在最大化利用这些技术,以提升机器人的功能。云机器人的潜在好处可以归纳为四大创意。
3.1 创意1:基于记忆的自治
在计算和存储能力的飞速发展中,研究者们开发了基于记忆的方法来处理感知、规划和控制问题,这些方法可以为机器人更大的自治提供发展空间。不是将任务分解成一系列专门针对特定环境的手动编码算法,而是搜索大量以前的经验记忆,根据与先前经验匹配的程度来给出机器人的响应。如果没有匹配的经验,则可以在相似的经验之间插值,或者寻求人类的帮助。将人类提供的答案记录下来,供该机器人和其他机器人未来使用。
快速搜索互联网信息的算法取得了飞速进步,进一步提高了基于记忆的方法的可行性。使用基于云的计算,在查找现有实例时可能会发现许多外部计算资源,且只需花费很少的通信量。但是,要想实现基于记忆的方法,解决方案的记忆来源在哪里?
3.2 创意2:快速分享经验
单个机器人如果采用基于记忆的方法来提高其自治能力,就好比一个刚出生的婴儿,可能需要几十年才能学会某些技能。实际上,机器人可能会比小孩子反应更慢,因为机器人不具备直觉。
虽然人类大脑的外部通信带宽远高于机器人,但人类与他人通信的速度却很低,大约在10比特/秒。机器人和计算机的通信速度通常超过1GB/s,比人类快一亿倍。鉴于外部通信速度的巨大差距,利用无线通信和互联网技术可以将某个机器人学到的知识与其他机器人共享。人类需要一到二十年才能将常识概括出来,但机器人不仅能够互相学习,而且可以从出生开始就进行知识概括。
未来的机器人可能会拥有高性能的“大脑”,从云端缓存记忆,只有在不确定如何行动时才会使用互联网。另一种可能性是,高速互联网通信意味着大部分机器人智能都是通过云端计算资源实现的(就像现在的一些视频游戏一样)。具体会是哪种情况,目前还无法确定。无论哪种情况发生,高速通信和互联网都会像催化剂一样,迅速提升机器人的功能。
3.3 创意3:从想象中学习
人类通常通过想象来为未来可能发生的事情做准备。类似的,机器人——或者说带云计算大脑的机器人——可以通过仿真来探索未来可能遇到的情况,并尝试各种可能的解决方案,最终记住那些有效的解决方案。这些仿真不需要真实的物理活动就能完成,每个机器人的想象都会提高其他所有机器人的功能。
3.4 创意4:向人类学习
感知仍然是机器人自治中最具挑战性的内容之一。近年来,通过大量数据集催化感知已被证明是非常强大的。大数据集也可能对机器人的规划和控制产生重要支持。
录制目标物体和人类活动的视频,并将这些视频作为在线知识库,可以为机器人提供丰富的资源,以提升其理解和接触真实世界的能力,包括与人类的互动。社交媒体在2013年和2014年上传了超过10^12张照片(Meeker 2014,幻灯片62),按照这一增长速度,2015年上传的照片将增加10^12张。目前,每分钟有300小时的视频上传到YouTube网站上,主要内容是展示人与人及人与环境如何互动(见https://www.youtube.com/yt/press/statistics.htm)。随着3D传感器的普及,这些数据资源将进一步丰富。
虽然大部分互联网上的视频信息没有标注,但集群技术可以用来识别图片和视频中的相似组件——例如,我们将相似的脸部分组——这样的话,当某个视频实例的意义被机器人学会(可能是通过人工标注告知机器人的),这些信息可以用于理解其他图片和视频。这些资源的应用速度呈指数增长。
虽然机器人“寒武纪大爆发”无疑会极大地改善人们的生活条件,但它也可能成为一个颠覆性的经济力量,部分原因是人们常讨论和担心机器人会让某些岗位变得多余。尽管存在这些担忧,我们应该持积极态度迎接即将到来的机器人变革。以鲁滨孙漂流记为例——一个被困荒岛的人不需要金钱。如果这个人利用一个或一组机器人来促进生产,他是否会从中获利?答案显然是肯定的。最基本的经济观点是,机器人创造财富,但传统的通过人工劳动分配这些财富的方式可能会出现问题。在这里,我将提供一个非经济学家的观点和想法,讨论机器人对不断变化的劳动力产生的潜在影响。我还会讨论通过人力分配财富的其他方法。这些方法包括人性化服务、通过资本分配以及其他一些新方式——信息经济中的个人偏好。
4.1 消费、需求饱和和人类适应
传统意义上,技术和劳动力市场的相互作用遵循一定模式。技术会提高某个领域的生产能力。虽然该领域的产品需求可能会基本饱和,但人们不会停止追求愿望的满足,很快就会发现新的需求。虽然部分劳动力会随着技术的扩展而重新配置,但劳动力市场的供需关系会带来一系列变化,以便劳动力流向新需求所在的领域,从而避免失业率持续上升。相反,平均工资可能会下降,因为技术提高了劳动者的生产效率。例如,尽管纺织业的工业革命创造了恶劣的工作环境,但纺织品产量上升和价格下降,使得消费者(通常是纺织工人自己)能够负担得起以前超出他们经济能力范围的纺织品。这些节省下来的钱会被用于购买其他产品,包括一些新产品。之后,纺织行业的工作条件会改善,劳动力会多样化。
尽管每隔几十年人们都会担心自动化会导致失业,但这种普遍模式在过去两个世纪的不同经济领域中反复得到验证。然而,这一次的情况可能不同。当机器人功能迅速提升时,与之前的几次技术浪潮相比,机器人可能会在更短时间内调配更多数量的劳动力。更高级的机器人功能可能会降低许多行业的劳动力价值。人类作为劳动力供应者,即使在受过高等教育的社会中,提升速度也很慢。换句话说,机器人功能提升的速度如此之快,以至于许多工人会发现自己几乎没有什么可以出售的技能。
从长远来看,人类对产品和服务的需求量和多样性不会饱和,因此,经济发展对劳动力的需求量并没有减少。但是,当机器人的功能超过普通人类的劳动力能力时,这种情况还会继续成立吗?我们可以设想,在未来,大多数人需要的许多物资将由先进的机器人以非常低的成本生产出来。这种经济会以多种方式发展。但一个可能的结果是,机器人对许多经济部门的影响类似于今天互联网对音乐行业的影响——即形成一种经济模式,少数极具天赋的超级巨星获得高额收入,而其他人只能获得较低的报酬。在本章接下来的内容中,我将提出几种解决这一问题的可能方法。
4.2 人性化服务
目前,即使机械制造的产品比手工制造的产品更具多样性,手工制造的产品价格通常更高,因为使用了稀缺商品——工匠的时间。这种情况有很多例子。即使音乐唱片行业崩溃了,现场音乐会依然有很好的市场。虽然唱片录制的质量和效果总是优于音乐会,而且音乐会通常在嘈杂的环境中举行,不如录制唱片的环境安静,但两者仍有差异。一群人参加现场音乐会的感觉比一个人在家听唱片或收音机更带劲。没有人会穿一件演唱会的T恤,听的却是录音。
因此,某些人性化服务总是比机器人提供的服务更贵。那么,当机器人制造的替代品非常便宜时,未来的经济是否将主要基于个性化和手工产品?虽然现场音乐会很受欢迎,但人们听到的绝大部分音乐还是录制的。
4.3 机器人资本所有权的分配
让我们想象一下,在一个假设的经济体系中,每个人都拥有一个机器人,并让机器人代替自己工作。在这种世界里,经济将顺利发展,我们将有更多的闲暇时间,由我们的机器人替身养活我们。当然,如何分配、交易和确保机器人资本不会破产等问题都需要妥善处理。然而,现有的资本交易体系将为未来的机器人资本分配提供一些基础。在现有的分配体系下,投资者的智慧(包括运气)决定了谁分得多谁分得少。James Albus是一名工程师,曾任美国国家标准与技术研究院制造工程实验室智能系统部门负责人,在1976年出版的《人民资本主义:机器人革命的经济学》和2011年出版的《通往更美好世界的道路:繁荣、机会和经济正义的计划》中深入探讨了这些问题和可能性。
4.4 信息经济中的个人偏好
在机械化之前,人类天生就拥有后天资本——自己的身体,用于生产各种具有经济价值的产品。当技术降低了机械劳动力的价值时,身体的经济价值下降了,但人脑的内在价值增加了。如果人脑的价值也像身体一样下降,人类还有什么内在价值?有趣的是,一种新的人类资本正在上升——个人偏好。
互联网公司提供搜索、电子邮件、地图等计算机工具软件,并通过用户使用这些工具软件收集个人偏好——通常是免费的。这些收集到的信息随后被卖给广告商,广告商利用这些信息瞄准那些最有可能购买某些产品的人。这些公司的业务本质上是利用个人偏好信息获取利润。许多人尚未意识到他们的个人偏好的价值,尽管这些公司收集和出售这些信息已经获得了客观利益,这充分证明了个人偏好的价值。
在未来的机器人经济中,人体和人脑的各种生理特性经济价值会下降,但个人偏好作为人类内在价值将继续存在。如果人们不轻易地将自己的个人信息交出去,可以想象,在财富分配中起重要作用的互联网公司将需要定期补偿那些提供个人信息的人。
人脑不仅能存储大量联想,还能迅速调用这些记忆。人脑将传感和其他信息转化为广义表示。对于一些不重要的变化,这些广义表示保持不变。人脑还存储情景记忆,将学到的实例抽象为理解。关于机器人功能尚未解决的重要问题是广义知识表示和基于这些表示的认知。计算机如何记住广义表示,并通过基于记忆的方法检索这些广义表示?如何确保相似但不完全相同的情况能够调用适当的记忆和想法?
许多重要的线索来自对人脑的深入了解,新型的人脑成像工具加快了人们对大脑的理解速度。一些机器学习算法,如之前提到的深度学习,正在被应用,试图自动发现广义表示。尚不清楚这个问题多久能得到解决。也许只需要几年时间,但也可能需要更长时间。机器人功能已经取得了巨大进步,但我们仍然面临着广义知识表示等难题。一旦这些问题得到解决,机器人功能的提升将以浓墨重彩的方式开始,并很可能呈现爆炸性增长,对经济产出和人类生活产生深远影响。