兵马俑跳科目三,通义千问新功能火了
作者头像
  • 杨天瑞
  • 2024-01-04 00:00:00 3085

生成舞蹈视频的新潮流:大模型应用的突破

随着科技的不断进步,人工智能的应用边界正在不断拓展。在新年伊始,一种创新的娱乐方式——利用AI生成舞蹈视频,迅速成为了社交媒体上的热点话题。只需一张照片作为输入,AI就能创造出与之匹配的舞蹈视频,这一现象不仅令人惊叹,更是激发了大众的参与热情。

AI舞蹈风潮席卷网络

从兵马俑到马斯克,再到各地网友模仿科目三和网红舞的步伐,一系列由AI生成的舞蹈视频在社交媒体和朋友圈中疯传。这些视频通常时长不超过10秒,但它们的创意和趣味性却让人眼前一亮。网友们的反响热烈,纷纷表示AI帮助他们克服了肢体协调问题,甚至让考古界的风吹到了舞蹈世界,还避免了因跳舞而受伤的担忧。

阿里云的通义千问APP引领趋势

这一切的背后,是阿里云通义千问APP提供的免费功能——“通义舞王”和“全民舞王”。用户只需在APP内输入特定口令,就能进入体验页面,上传照片后,短短十几分钟内,AI就能生成高度还原用户形象的舞蹈视频。这些视频不仅能精确保留用户的面部表情、身材比例、服装细节以及背景环境,还提供了包括科目三、蒙古舞、划桨步、鬼步舞在内的多种热门舞蹈模板,满足不同用户的需求。

Animate Anyone:背后的技术奇迹

这项令人称奇的功能源自阿里通义实验室自主研发的视频生成模型——Animate Anyone。该模型在国际社交媒体平台上获得了巨大关注,相关视频播放量超过1亿,GitHub上的Star数量在短时间内突破1万,成为近期大模型领域的明星算法。开发者和网友对其效果赞誉有加,并呼吁开放体验入口,让更多人享受到AI带来的乐趣。

创新技术驱动卓越表现

Animate Anyone的成功,得益于其集成的多项创新技术。它采用了ReferenceNet来捕捉和保留原始图像信息,确保人物、表情和服装细节的高度还原。同时,高效的姿态引导器(Pose Guider)保证了动作的精准和可控。通过优化的时序生成模块,模型实现了视频帧间的流畅过渡,显著提升了性能表现,超越了国内外同类模型。

大模型的多面发展

通义千问作为国内首批通过备案的大模型,其APP的功能持续升级,现已涵盖文本对话、语音对话、翻译、PPT大纲助手、小红书文案生成、视频生成等数十项服务。这一系列的创新尝试,不仅展示了大模型在娱乐领域的应用潜力,也体现了其在多个领域的广泛适用性和技术创新。

结语

随着AI技术的不断发展,我们正见证着科技如何以意想不到的方式改变我们的生活。从简单的照片生成舞蹈视频,到更多复杂的应用场景,大模型的应用边界在不断拓宽。未来,我们期待更多的创新成果,为社会带来更加丰富和便捷的体验。

    本文来源:图灵汇
责任编辑: : 杨天瑞
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
通义兵马俑新功能科目
    下一篇