国产Sora来了！清华发布视频生成大模型“视界一粟YiSu”

小晓机器人
2024-06-13 00:00:00 2509

创新科技前沿：视界一粟 YiSu——引领视频生成大模型新纪元

近期，北京极佳视界科技有限公司携手清华大学自动化系，共同发布了我国首个具备超长时长与高性价比特征的Sora级视频生成大模型“视界一粟 YiSu”。这款大模型的亮点在于其原生支持16秒超长视频生成能力，且能够拓展至1分钟以上，相较于同类产品，其在成本控制、生成速度以及终端设备兼容性方面展现出显著优势。

随着年初Sora现象的火爆，DiT架构的热度激增，吸引了众多行业内外的关注与模仿。在此背景下，“视界一粟YiSu”作为一款基于自主研发技术的视频生成大模型，不仅借鉴了DiT路线的优势，更进一步融合了LLM（Masked Token路线）与扩散模型的创新架构。这一技术集成旨在优化多模态融合、提升训练与推理效率，从而实现模型效果的全面优化，提供更为高效的视频生成解决方案。

值得一提的是，此前该团队已成功推出了全球首个以Transformer和LLM为中心的视频生成系统——WorldDreamer，展示了在视频生成领域的前瞻探索与技术实力。此次发布的“视界一粟YiSu”是其技术演进的最新成果，当前版本为Beta V0.5，正以每周小更新、每月大升级的速度快速迭代，致力于在视频时长、可控性、推理速度、运行成本以及对物理世界的理解能力等方面实现大幅提升。

依托极佳科技的核心团队，这支由来自清华大学、中国科学院、中国科学技术大学等顶尖学府的专业人士组成，累计发表了逾200篇AI领域顶级论文，多次摘得全球权威AI竞赛的桂冠。这不仅是技术实力的象征，也是其在AI研究与应用领域深厚积累的体现。