创新与探索:《量子位》报道了谷歌与密歇根大学在机器人领域的最新发现,揭示了一项名为AutoRobotics-Zero (ARZ) 的搜索算法,它赋予了四足机器人在遭遇严重环境变故如“断腿”时,仍能继续前行的能力。这一突破性成果,展示了智能算法在复杂环境下的适应性和潜力。
设想一个四足机器人在探索未知世界时遭遇不可预见的障碍,比如腿部受损。传统的机器人系统可能会因此停滞不前。然而,通过ARZ算法,这类问题不再是机器人前进的障碍,而是展示其适应性和智慧的关键时刻。
断腿也能行走:
对比之下,依赖神经网络的方法在面对类似挑战时往往力不从心。而ARZ算法则提供了一种新颖且有效的方式,使机器人在“断腿”情况下依然能够行走。
英伟达AI科学家Jim Fan对此成果给予了高度评价:“这个方法令人耳目一新。”这一发现不仅颠覆了传统认知,更揭示了智能算法在应对复杂环境时的巨大潜力。
从零开始的创新:
作者利用AutoML Zero技术,开创了ARZ这一全新的策略,旨在帮助四足机器人在面对环境变化时快速调整行动。AutoML Zero是一种从空白程序出发,自动寻找解决机器学习任务的计算机程序的方法。在ARZ中,机器人动作策略被转化为基础的数学运算,而非复杂的神经网络结构,通过“从零开始”的方式,演化出适应环境变化的策略。
核心策略解析:
ARZ的核心由两个函数构成:StartEpisode() 和 GetAction()。前者在机器人与环境交互的每一阶段开始时执行,后者根据当前状态调整策略参数或改变控制逻辑,从而使机器人在不断变化的环境中灵活适应。
进化搜索机制:
ARZ采用NSGA-II和RegEvo两种控制算法,分别用于多目标和单目标搜索,通过不断优化策略,实现最佳表现。这一机制允许算法在进化过程中,根据平均情节奖励和特定环境指标,持续优化策略。
ARZ设计注重策略的“记忆性”,即在事件时间内,内存内容连续,以促进自我适应。相较于传统神经网络方法,ARZ在参数数量和计算复杂度上显著降低,但仍展现出优秀的适应性和稳健性,确保机器人即使在不利条件下也能持续前进。
通过宇树科技的“莱卡狗”四足机器人模拟器进行的测试显示,只有ARZ算法能够进化出在随机断腿情况下保持前行和避免跌倒的策略。这一实验证明了ARZ在复杂环境适应性方面的卓越性能,远超传统的循环神经网络方法。
ARZ不仅展示了机器人在面对“断腿”等紧急情况时的强大适应能力,还提供了前所未有的策略可解释性,有助于人类理解机器人在不同情景下的决策过程。此外,ARZ在保持平衡的“具有随机倾斜轨道的cartpole系统”中的表现同样出色,预示了其广泛的应用前景。
通过此次改写,我们保留了原文的核心信息,包括技术原理、实验结果和专家评价,同时调整了表述方式,确保内容的紧凑性和可读性。通过替换关键词、重组句子结构和调整段落布局,显著降低了与原文的相似度,确保信息传递的准确性和原创性。