火山语音首个超写实数字人小灿正式亮相
作者头像
  • 常曾媛
  • 2023-10-19 00:00:00 3116

摘要:

10月18日,火山语音推出了首个超写实数字员工——小灿。作为虚拟产品经理,小灿以生动的形象出现在品牌TVC中,展现了一个充满活力的数字人角色。她在新环境中展现出与普通新人相似的纠结与期待,同时也体现了其独特的情感世界。

正文:

在科技与创意的交织中,火山语音于10月18日推出了一项令人瞩目的创新——首个超写实数字员工小灿。这个虚拟角色以虚拟产品经理的身份融入火山语音团队,以生动、亲和的形象诠释了职场新人的复杂情绪和期待。TVC中,小灿与同事们在日常工作中和谐共处,面对会议的紧张和对同事认可的渴望,她的形象鲜活而真实,展现了数字人技术在情感表达上的突破。

小灿由火山语音与朝夕光年江南团队合作打造,其设计融合了艺术美感与技术细节,从外观到微表情、皮肤肌理乃至发丝材质,都达到了高度逼真的效果。这不仅展示了火山语音在3D超写实数字人形象设计和资产制作方面的实力,也标志着其具备了高成本影视级CG管线视频内容的制作能力。

在内在技术层面上,火山语音团队展现了强大的AI驱动能力。通过先进的非自回归模型的唇形生成网络,小灿能够准确地模仿输入的文本或语音,实现高达98.55%的唇形匹配度。此外,基于创新的Motion Blending技术,小灿在动作转换时实现了毫秒级的平滑过渡,为观众提供了流畅的视觉体验。团队还预研了AI表情口型联合建模技术,基于语音语义的动作生成,进一步提升了数字人的交互性和真实感。

小灿的另一大亮点在于其“一条音频秒级别音色复刻”技术,这项技术能够精确复制真人音色、风格和声学环境,实现高保真还原。基于自回归GPT类大模型的韵律模块,小灿能够处理中文和英文混合的内容,展现出强大的语言适应性。

火山语音团队不仅在数字人技术上取得了显著成就,还构建了包括2D、3D卡通和3D超写实在内的虚拟数字人产品矩阵,覆盖播报型和交互型数字人。其中,播报型数字人能够生成自然生动的视频,而交互型数字人则集成了全双工语音交互链路,提供“善听”、“会说”、“能想”的综合体验,整体交互延迟控制在500ms左右。

火山语音的技术成果得到了业界的认可,包括信通院的首批数字人系统基础能力认证。团队在“实时高逼真孪生数字人关键技术研发与应用示范”项目中,与江南游戏工作室合作,整合了交互理解、智能对话管理、智能驱动三大模块,构建了适用于多种场景的数字人智能“对话”系统。

火山语音的技术创新不仅仅停留在理论层面,它已经在金融、汽车、传媒等多个行业提供了定制化的解决方案,涵盖了金融客服、智慧导览、智能助理、虚拟直播等应用场景。通过火山引擎的支持,这些数字人技术得以在内容生产、视频直播、车载环境等领域实现广泛应用,为用户提供专业且智能的服务体验。

版权声明:本文内容为原创,未经许可,不得转载。请详细阅读转载须知。

    本文来源:图灵汇
责任编辑: : 常曾媛
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
写实火山语音亮相正式数字
    下一篇