背景介绍
当前,研究领域正积极探索如何通过神经辐射场(NeRF)技术实现对三维场景的高效重建与新视角合成,这一过程相较于传统方法显著简化了现实世界物体与场景转化为3D图形资源的流程。然而,面对已捕获的NeRF场景进行编辑时,由于场景的几何与纹理信息嵌入在高维神经网络特征中,编辑操作往往显得复杂且不易实现。
方法概述
《DreamEditor:基于神经场的文本驱动3D场景编辑》一文,由中山大学HCP实验室与宾夕法尼亚大学Penn Computer Graphics Lab实验室合作发表,并已成功被SIGGRAPH Asia 2023接收。该论文提出了一种创新性的NeRF编辑框架——DreamEditor,旨在通过结合预训练的文本到图片扩散模型(stable diffusion),让用户能够借助文本提示对NeRF进行精确控制的编辑。
关键步骤
实验结果与应用
实验结果显示,DreamEditor能够在各种复杂场景中实现高效、精准的编辑操作,包括户外花园中马雕塑的替换为鹿或长颈鹿,以及局部细节如为狗佩戴太阳镜等。方法的生成结果在3D几何与纹理一致性方面表现出色,用户满意度高,特别是在与现有方法的对比中,DreamEditor获得了显著优势。
定位步骤的重要性
对比实验显示,DreamEditor的定位步骤对于精确编辑至关重要。无定位情况下,编辑操作可能导致无关区域的误编辑,破坏场景的一致性。而通过定位步骤确定编辑区域,仅优化感兴趣的区域,显著提高了编辑效果与效率。
用户反馈与视频展示
用户对DreamEditor的编辑效果给予了高度评价,投票结果显示其满意度超过81.1%,远超其他方法。此外,DreamEditor的编辑样例在相关视频中进行了展示,供有兴趣的用户进一步了解与参考。
中山大学人机物智能融合实验室(HCP Lab)成立于2010年,由林倞教授领导。该实验室在多模态内容理解、因果与认知推理、具身智能等领域取得了显著成就,并多次荣获国内外科技奖项与最佳论文奖。致力于将先进的AI技术与产品化平台相结合,HCP Lab在推动人工智能领域的创新发展方面发挥着重要作用。欲了解更多详情,欢迎访问实验室官网:中山大学人机物智能融合实验室。