导览
Nature正刊揭示了自动驾驶领域的重要突破。研究证明,自动驾驶算法的安全性和可靠性得到了显著增强,专家估计的仿真里程达到了惊人的千亿英里。然而,如何在保证这一高标准的同时,大幅度削减模拟路测的时间和成本,成为业界关注的焦点。
最新研究提出了一种自动驾驶仿真测试方法,能够将模型迭代效率提升至惊人的2000倍。这项成果由密歇根大学刘向宏教授团队主导,成员皆为来自清华大学自动化系的华人学者。
自动驾驶仿真测试的效率问题一直是行业内的巨大挑战。传统仿真测试通常依赖于真实路测数据生成环境,但真实路况中的极端情况往往难以频繁出现,导致有效测试场景的比例不高,实际效果与实车路测相差无几。而基于密集强化学习的深度学习网络D2RL则提供了一种解决方案。
D2RL通过精炼仿真场景生成过程,显著减少了无效场景的产生,将基于自然驾驶环境(NDE)的仿真模拟效率提升了2000倍。在特定的双车道400米场景中,D2RL生成的测试直接跳过了95.7%的常规事件和99.78%的步骤,使得算法在相同的收敛标准下,NDE环境需训练1.9×10^8次,而D2RL仅需9.1×10^4次,效率提高了约2100倍。
在更复杂的3车道、长距离实验中,D2RL同样展示了类似的效率提升效果,均在2000倍左右。研究团队还展示了将开源自动驾驶算法Autoware23集成至林肯MKZ车型上,进行4公里左右的实际道路测试,并将其场景构建与D2RL结合。在两种不同路径的测试中,分别在156和117次测试后达到收敛状态,而NDE条件下的测试则分别需要2.5×10^7和2.1×10^7次,效率同样提高了约2000倍。
使用D2RL进行自动驾驶算法模拟仿真训练,能够极大地缩短开发周期,不仅适用于自动驾驶领域,还能在医疗机器人和航空航天系统等其他AI可靠性验证中发挥重要作用。
D2RL之所以能够实现如此高效的仿真,关键在于其对系统生成仿真场景过程的“提纯”。它专注于识别并去除高维空间中非安全关键的数据,保留安全关键数据用于训练神经网络,从而有效提高了算法碰撞率的收敛速度。
该研究团队由封硕担任第一作者,现为密歇根大学安娜堡分校博士后研究员。封硕拥有清华大学自动化系的本科学位和博士学位,专注于优化控制、互联和自动驾驶评估以及交通数据分析。他的研究工作在刘向宏教授的指导下进行,后者是密歇根大学土木与环境工程系终身教授,密歇根大学交通研究所的研究教授。此外,团队还包括密歇根大学土木与环境工程专业的博士生Sun Haowei,以及刘向宏教授本人,他是交通工程领域论文引用率极高的学者之一,以其发明的SMART-Signal系统闻名,该系统已被广泛应用于美国多个州。
总结
Nature正刊的这一报道标志着自动驾驶领域的一次重大技术飞跃,通过D2RL的引入,自动驾驶算法的仿真测试效率得到了显著提升,为自动驾驶技术的快速迭代和应用提供了强有力的支持。随着这一技术的进一步发展和应用,自动驾驶的未来有望更加安全、高效和普及。