导览
初创企业Wayve正引领无人驾驶汽车领域的新篇章,其最新研发的无人驾驶系统已具备与人类对话的能力。此创新旨在运用与ChatGPT相似的技术,为无人驾驶汽车提供更智能的决策支持。通过整合其自主研发的自动驾驶软件与大规模语言模型,Wayve成功构建了一款名为LINGO-1的混合模型。
LINGO-1的独特之处在于,它能够将视频流与驾驶数据(汽车每秒执行的操作)相匹配,并同步生成对汽车所见所为的自然语言描述。这一技术的引入,使Wayve的无人驾驶汽车能在真实环境中接收实时AI训练,显著提升其自主决策的准确性和适应性。
在过去几年里,Wayve取得了多项里程碑式的成就。在2021年,它展示了无人驾驶车辆如何在伦敦的街道上接受人工智能的训练,并扩展至英国其他四座城市,这通常需要大规模的工程改造。2022年,Wayve实现了在同一项目中使用不同型号的车辆进行人工智能驱动,这是汽车行业前所未有的突破。如今,这一创新进一步延伸至与汽车的语音交互。
在一次演示中,Wayve的CEO艾利克斯肯德尔展示了LINGO-1的强大功能。通过输入简单的查询,如“天气如何?”或“你看到了什么危险?”,系统能迅速作出响应,比如回答“天气多云”或“左边有一所学校”。这一能力不仅令人印象深刻,而且揭示了人工智能在安全领域的潜力。
Wayve的愿景在于通过与汽车的对话,深入了解其决策逻辑,从而快速定位和修复潜在问题。相较于传统的视频回放或错误报告分析,这种方式提供了更为即时和深入的洞察。这一创新有望显著提升自动驾驶的安全性和可靠性。
皮特阿比尔,加州大学伯克利分校的机器人研究员和机器人公司Covariant的联合创始人,对LINGO-1的演示表示高度赞赏。他表示,系统在面对复杂驾驶情境时,几乎总是能给出准确的答案,展现了强大的应用潜力。
Wayve的创新之路并未止步于此。公司计划进一步深化与语言的互动,通过让其专业司机团队(包括前驾驶教练)在驾驶过程中大声讲解操作细节和决策理由,以此对LINGO-1进行微调。这种方式不仅加速了训练过程,还能让模型习得更多实用的驾驶技巧。
值得注意的是,Wayve并非首个在机器人技术中应用大型语言模型的公司。谷歌和Abbeel的Covariant公司等,同样在探索利用自然语言来测试或引导家用和工业机器人。然而,将视觉语言动作模型(VLAM)应用于自动驾驶领域,Wayve则首开先河。
面对语言模型带来的挑战,Wayve深知其局限性。尽管LINGO-1的回应基于相关视频数据,但仍存在生成不实信息的风险。对此,公司正积极采取措施,力求提高模型的准确性,并确保生成的语言表述清晰、可靠,避免误导。
艾利克斯肯德尔强调,语言在人类智能进化中扮演着关键角色,未来与机器人的交互也将主要依赖于语言。这一观点得到了皮特阿比尔的认同,他预测机器人技术将迎来革命性的变革。
威尔道格拉斯海文,作为《麻省理工科技评论》人工智能专栏的高级编辑,对Wayve的进展给予了高度评价。他指出,通过与英国广播公司科技与地缘政治网站Future Now的创刊编辑以及New Scientist杂志的首席技术编辑经历,威尔对于人机协作的深刻理解,为报道Wayve的创新提供了独特的视角。
总结
Wayve的最新进展标志着无人驾驶领域的一次重大飞跃,通过引入与ChatGPT相似的技术,其无人驾驶汽车不仅能执行复杂的驾驶任务,还能通过语音与人类进行交流,解释其决策过程。这一创新不仅提高了自动驾驶的安全性和效率,也为未来人机交互方式开辟了新路径。随着Wayve继续推进其研究和开发,我们期待看到更多创新成果,推动无人驾驶技术向前发展。