近年来,AI大模型技术在某些细分领域取得了显著进展,同时也推动了具身智能技术的发展。然而,通用AI大模型与具身智能行业的实际应用之间存在一定差距,主要是因为通用AI大模型难以适应具身智能的具体应用场景。
为此,国内多家机器人公司纷纷开发专门适用于机器人领域的智能系统。其中,深圳的一家名为“若愚科技”的创业公司专注于多模态大模型机器人大脑的研发,这家公司在业内颇具代表性。
近期,若愚科技推出了其自主研发的若愚·九天机器人大脑,该系统通过多模态大模型驱动,实现了群体智能,并在无人厨房环境中进行了技术验证。这款机器人大脑能够通过自然语言处理技术,实现从点餐到上菜的全过程自动化操作,包括复杂的烹饪过程。
与当前市场上常见的具身智能技术相比,若愚·九天机器人大脑具备更强的人类意图理解能力和复杂任务规划功能。例如,当用户要求“炒一份清炒生菜”时,机器人能够理解用户的意图并自动规划任务流程,将其分解成一系列具体的步骤,如获取食材、准备配料、烹饪和上菜等。
此外,若愚·九天机器人大脑还具有较强的泛化能力。例如,在训练过程中,虽然只告诉机器人需要加入蒜,但在实际操作中,如果用户要求加入辣椒,机器人也能自动理解辣椒也是配料,并据此调整烹饪步骤。
据若愚科技首席产品官邓煜平介绍,若愚·九天机器人大脑的一大亮点在于,它能够通过多模态大模型驱动,实现多智能体之间的自主分工与协作。这使得多台机器人能够高效地共同完成复杂任务,而不需要人为干预。例如,在炒菜的同时,另一台机器人可以自主决定接下来的任务,从而提高整体工作效率。
除了在任务规划方面的创新,若愚·九天机器人大脑还在控制机器人执行层面进行了技术优化。例如,针对环境感知难题,若愚科技研发了大模型3D可供性感知技术,使机器人能够更准确地识别和抓取各种物体。同时,为了应对复杂动作执行难题,若愚科技引入了扩散模型驱动的模仿学习技术,实现了复杂技能和动作的精确执行。
目前,国际上也有一些在具身智能领域取得成果的研究团队和公司,如谷歌人工智能团队的PaLM-E、谷歌DeepMind团队的RT-1/RT-2/RT-X以及Open AI投资的Physical Intelligence等。
若愚科技成立于2023年,脱胎于哈尔滨工业大学(深圳)计算与智能研究院团队。据36氪报道,若愚科技在今年3月完成了超过5000万元的天使轮融资。
未来,若愚科技计划将九天机器人大脑及其相关技术应用到更多领域,包括工业生产中的复杂工序、物流分拣、混合码垛、无人零售、无人药房、立体清洁等,甚至扩展至消费市场。
附完整视频链接:https://v.qq.com/x/page/a3551ly2qji.html