德国卡尔斯鲁厄技术学院的研究人员最近开发了一款交互式无人机,旨在协助人类在室内环境(如办公室或实验室)中完成任务。在一篇预发表于arXiv的论文中,研究人员介绍了他们在实验室中进行的一些实验及其成果。
研究人员在论文中表示:“我们设计了一款室内办公助手无人机,其主要职责是在实验室中执行各种任务,并能根据人类的指示进行操作和互动。”
研究团队采用了一种以“任务”为核心的无人机设计理念。“任务”是指无人机能够接收输入参数,并满足特定的目标条件。为了成功完成任务,无人机需要具备实现所有相关目标的能力。
研究人员指出:“我们的系统需要接受飞往某个地点(房间或人)的行动指令作为输入参数。无人机的任务是在无人工干预的情况下抵达目标,并且不会与其他静止或移动的障碍物发生碰撞。”
研究团队展示的交互式无人机是对Crazyflie 2.0无人机的改进版本,由Bitcraze公司设计。这款无人机配备了多个组件:自动语音识别(ASR)子系统用于记录用户的行动请求;对话系统负责接收请求、处理并确定办公室内的目标;还有飞行控制器,负责规划无人机的轨迹并避免与障碍物碰撞。
为了评估系统的各个部分,研究人员分别测试了每个组件的功能。他们要求三位非英语母语者大声发出简单的行动指令,例如让无人机飞到另一个房间或拜访实验室里的其他人。随后,研究人员通过向无人机展示三种不同类型的障碍物(关闭的门、人和金属长椅),测试了无人机的深度感知和避障能力。最后,他们通过书面说明来测试无人机完成任务的速度。
尽管无人机完成任务的成功率为77.78%,但研究团队发现了一些局限性。最常见的失败原因之一是无人机在着陆时会轻微偏转,因为四个螺旋桨并非同时启动。
研究人员提到:“作为我们的首个原型,我们在单个组件及整个系统方面都还有很大的提升空间。”
研究团队发现,无人机的对话系统表现不佳,最多只能在57%的情况下正确理解人的指令。主要问题是,自动语音识别系统在听到用户的名字时会提前结束语音识别过程。
研究人员在论文中提到:“未来,我们将采用改进的语音识别系统。另外,为了在不增加训练数据集规模的情况下支持更多自然语言,我们还将采用多任务学习方法。这意味着无人机的数据集将与外部数据集一起进行训练。”
在最后的测试中,无人机的碰撞检测组件表现良好,能够在大多数情况下有效避免与人和大型物体的碰撞。然而,它难以检测到非常细或半透明的家具。为了克服这一限制,团队正在考虑创建更加精确的实时环境地图,因为目前的系统依赖于预先记录的二维地图。
研究人员指出:“减少位置误差也有助于提高我们的整体任务成功率,因为在测试期间,位置误差是导致任务失败的主要原因之一。另一个问题是深度感知系统在非常明亮或光线变化的条件下表现不佳。我们计划在未来解决这些问题。”
此外,在接下来的研究中,研究团队希望能够延长无人机系统的电池寿命和优化电池管理。目前,该系统只能连续执行三到四个任务就需要充电。他们希望大幅增加这一数字,并提出一些新解决方案来缓解这个问题。