Sora催化算力需求持续暴涨,基础设施厂商进一步受益
作者头像
  • 苏慧娟
  • 2024-02-19 00:00:00 3038

引言

在AI视频生成领域,一系列创新模型如雨后春笋般涌现,其中“Sora”作为最新“王炸”模型的横空出世,标志着AI视频生成迎来了前所未有的“GPT时刻”。这款扩散型Transformer模型,以其卓越的视频生成效果,将视频时长提升至1分钟,角色表情栩栩如生,实现多角度镜头切换与流畅分镜,甚至能呈现出真实的光影、运动和镜头移动效果。

技术解析

Sora的核心技术亮点在于其采用的Diffusion Transformer等技术,使模型能够处理不同持续时间、分辨率和比例的视频/图像,进而创造出仿佛真实世界的“世界模拟器”,具备理解真实世界运动和物理特性的能力。相较于其他竞争对手,如Runway、Pika等,Sora的独特之处在于其强大的物理和运动学理解能力,使其生成的视频不仅局限于特定画面的记忆,还能准确捕捉并再现物理规律,如“咬了就会有痕迹”的现象,从而显著提升视频的真实感。

行业影响

世界模拟器作为AI生成视频的一种革新手段,其成功不仅推动了视频生成赛道的发展,加速了创新和成熟进程,也为整个行业带来了深远的影响。国内厂商对此反应迅速,加大了在AI视频生成领域的研发投入,纷纷推出适应不同需求的创新解决方案。例如,字节跳动推出的PixelDance模型不仅在视频时长上实现了突破,还通过结合文本、首帧指导和尾帧指导,生成包含复杂场景和动作的视频;万兴科技则在年初推出了国内首个以音视频为核心的大模型“天幕”,并迅速将其AIGC化,升级旗下多款软件,并推出了一系列AIGC新品。

市场竞争与差异化

尽管万兴科技的“天幕”与Sora在定位、能力和用户群体上存在差异,但两者都在各自领域内展现了独特的价值。万兴“天幕”作为音视频多媒体创作的垂类大模型,集成了当前市场上多种能力,而Sora则专注于视觉数据的底层通用模型,尤其擅长文生视频能力。面对AI视频生成市场的激烈竞争,万兴科技凭借其在海外的规模化商用经验,针对泛知识、泛营销、泛娱乐等领域提供了更加细分且针对性强的服务。

前景展望

AI视频生成赛道的前景广阔,随着短视频用户的持续增长,市场潜力巨大。据预测,至2023年末,国内短视频用户规模已突破10亿人,这为AI视频创意服务提供了庞大的市场需求。Sora的发布不仅验证了视频生成技术的成熟度,还预示着“视频+大模型”应用场景的无限可能。未来,随着全球算力需求的增长,大模型将更多地聚焦于本土化发展,以适应更个性化、本土化的市场需求,同时在全球范围内推动多模态大模型的竞争格局,促进技术的进一步革新和应用的广泛普及。

    本文来源:图灵汇
责任编辑: : 苏慧娟
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
暴涨催化基础设施受益进一步厂商持续需求Sora
    下一篇