在科技与艺术的交汇处,腾讯集团市场与公关副总裁李航的数字人分身揭开了第五届腾讯青少年科学小会的神秘面纱,与科学顾问王元卓共同开启了一场关于“数字生命体”的探讨,将科幻的奇思妙想转化为现实。
本届活动由清华大学、中国宋庆龄基金会、腾讯公司联合主办,以“用AI改编世界”为主题,汇集了科研机构、高等院校和AI行业的顶尖科学家,为全国青少年量身定制了一场独特的AI探索之旅。腾讯智影提供了强大的技术支持,让活动现场充满了令人震撼的数字人展示。
腾讯智影基于真实人物的视频,仅需3分钟即可快速生成高度逼真的数字人分身,无论是语音、语调、唇动还是习惯性动作,都与真人几乎无异,相似度高达98%。这些数字人不仅能够通过文本和语音输入生成播报视频,还能在不同场景下执行任务,如直播互动、乡村科普讲座等,极大地提升了效率和效果。
腾讯智影采用端到端的StyleTTV合成框架系统,结合云端视频创作平台的功能,实现了“输入即所得”的数字人多模态合成和视频生成。通过人脸检测算法分析面部关键点,建立面部模型,并与语音对应关系创建个人唇形库。基于大规模唇形预训练模型,结合语音识别模型,训练出能够预测匹配唇形的定制化模型,实现高度逼真的形象克隆。
在音色复刻方面,腾讯智影将人声拆解为口音、音色和韵律三个元素,通过自研声学模型记录声学参数和波形,实现音色和韵律的数字化建模。结合编码器进行口音控制,确保音色的高保真度。同时,借助NLP模型分析文本内容,预测相应的韵律、节奏、语气和情绪,使数字人具备丰富的情感表达,满足不同场景需求。
腾讯智影的数字人在多个领域展现出了开创性的应用,包括AI新闻主播、AI气象主持人、AI营养师、AI数字人法官以及AI手语合成主播等。在传媒领域,数字人主播如“任小融”和“长小姣”等,打破了时空限制,推动了媒体内容生产流程的革新,为观众带来了个性化的新闻播报体验。在医疗领域,数字人分身帮助解决老年人用药问题,促进了药品说明书的适老化改造。
通过此次活动,青少年不仅体验了AI的魅力,还通过“了不起的甲骨文”小程序深入了解汉字演变,参与“AI编程第一课”体验AI作曲等,激发了对科技的兴趣和创造力。腾讯AI技术的应用不仅展示了AI在改变世界方面的潜力,也引导青少年在日常生活中善用AI解决问题,培养科技能力,为未来铺路。
这场科技盛宴不仅是一次知识的传递,更是对未来科技人才的培养和激励,体现了腾讯在推动科技创新、促进社会发展的不懈努力。