在6月举办的全球计算机视觉盛会CVPR 2023上,商汤科技及其联合实验室展示了其在自动驾驶研究领域的创新成果,其中一篇论文荣获“最佳论文奖”。这篇题为《Planning-oriented Autonomous Driving》的研究首次提出感知决策一体化的自动驾驶通用大模型UniAD,标志着自动驾驶技术的里程碑式进步。UniAD以全局任务为目标,开创了自动驾驶大模型架构的新纪元,为自动驾驶技术与产业的未来发展指明了方向。
UniAD不仅整合了检测、跟踪、建图、轨迹预测、占据栅格预测以及规划等多个关键任务至一个统一的端到端网络框架之下,而且实现了多任务与高性能的完美结合。这一创新性框架在多项关键指标上显著超越了当前最先进的技术(SOTA),包括但不限于多目标跟踪准确率、车道线预测准确率、预测运动位移误差和规划误差,展现出显著的技术优势。
UniAD的成功不仅代表了自动驾驶技术的重大突破,还预示了未来自动驾驶技术发展的趋势。通过端到端的优化,UniAD在多个技术层面上实现了性能的大幅提升,这将对整个自动驾驶行业产生深远影响。
在另一项研究中,商汤科技推出了一项名为OmniObject3D的大型真实世界三维物体数据集,旨在促进计算机视觉领域内真实3D感知、重建与生成技术的发展。OmniObject3D包含近200个类别的高质量真实三维物体数据,涵盖了高精度表面网格、点云、多视角渲染图像和实景视频,为真实世界三维视觉研究提供了宝贵的资源。
借助OmniObject3D数据集,研究人员深入探讨了点云识别、神经渲染、表面重建和三维生成等任务的鲁棒性和泛化性,验证了其在感知、重建和生成领域的广泛应用潜力。这一研究对于AIGC时代真实感3D内容生成领域具有重要意义,有望引领该领域的技术创新和应用发展。
商汤科技在AI基础设施领域的持续投入,包括以大装置SenseCore和大模型为核心的战略布局,以及与产学研界的紧密合作,不断推动人工智能领域的创新和发展。通过这些努力,商汤正在为AI的前沿探索开辟新的方向和路径,特别是在气象预报、遥感解译、开放环境中的决策问题等领域已展现出显著的突破。
CVPR 2023不仅见证了商汤科技在计算机视觉领域的卓越成就,更是展现了其在自动驾驶和真实3D内容生成等前沿技术领域的前瞻性探索。通过不断的技术创新和产业应用,商汤科技正引领着人工智能领域的变革与发展,为未来的科技进步和社会福祉做出贡献。