兵马俑跳科目三，通义千问新功能火了

杨天瑞
2024-01-04 00:00:00 3085

生成舞蹈视频的新潮流：大模型应用的突破

随着科技的不断进步，人工智能的应用边界正在不断拓展。在新年伊始，一种创新的娱乐方式——利用AI生成舞蹈视频，迅速成为了社交媒体上的热点话题。只需一张照片作为输入，AI就能创造出与之匹配的舞蹈视频，这一现象不仅令人惊叹，更是激发了大众的参与热情。

AI舞蹈风潮席卷网络

从兵马俑到马斯克，再到各地网友模仿科目三和网红舞的步伐，一系列由AI生成的舞蹈视频在社交媒体和朋友圈中疯传。这些视频通常时长不超过10秒，但它们的创意和趣味性却让人眼前一亮。网友们的反响热烈，纷纷表示AI帮助他们克服了肢体协调问题，甚至让考古界的风吹到了舞蹈世界，还避免了因跳舞而受伤的担忧。

阿里云的通义千问APP引领趋势

这一切的背后，是阿里云通义千问APP提供的免费功能——“通义舞王”和“全民舞王”。用户只需在APP内输入特定口令，就能进入体验页面，上传照片后，短短十几分钟内，AI就能生成高度还原用户形象的舞蹈视频。这些视频不仅能精确保留用户的面部表情、身材比例、服装细节以及背景环境，还提供了包括科目三、蒙古舞、划桨步、鬼步舞在内的多种热门舞蹈模板，满足不同用户的需求。

Animate Anyone：背后的技术奇迹

这项令人称奇的功能源自阿里通义实验室自主研发的视频生成模型——Animate Anyone。该模型在国际社交媒体平台上获得了巨大关注，相关视频播放量超过1亿，GitHub上的Star数量在短时间内突破1万，成为近期大模型领域的明星算法。开发者和网友对其效果赞誉有加，并呼吁开放体验入口，让更多人享受到AI带来的乐趣。

创新技术驱动卓越表现

Animate Anyone的成功，得益于其集成的多项创新技术。它采用了ReferenceNet来捕捉和保留原始图像信息，确保人物、表情和服装细节的高度还原。同时，高效的姿态引导器（Pose Guider）保证了动作的精准和可控。通过优化的时序生成模块，模型实现了视频帧间的流畅过渡，显著提升了性能表现，超越了国内外同类模型。