近期,北京极佳视界科技有限公司携手清华大学自动化系,共同发布了我国首个具备超长时长与高性价比特征的Sora级视频生成大模型“视界一粟 YiSu”。这款大模型的亮点在于其原生支持16秒超长视频生成能力,且能够拓展至1分钟以上,相较于同类产品,其在成本控制、生成速度以及终端设备兼容性方面展现出显著优势。
随着年初Sora现象的火爆,DiT架构的热度激增,吸引了众多行业内外的关注与模仿。在此背景下,“视界一粟YiSu”作为一款基于自主研发技术的视频生成大模型,不仅借鉴了DiT路线的优势,更进一步融合了LLM(Masked Token路线)与扩散模型的创新架构。这一技术集成旨在优化多模态融合、提升训练与推理效率,从而实现模型效果的全面优化,提供更为高效的视频生成解决方案。
值得一提的是,此前该团队已成功推出了全球首个以Transformer和LLM为中心的视频生成系统——WorldDreamer,展示了在视频生成领域的前瞻探索与技术实力。此次发布的“视界一粟YiSu”是其技术演进的最新成果,当前版本为Beta V0.5,正以每周小更新、每月大升级的速度快速迭代,致力于在视频时长、可控性、推理速度、运行成本以及对物理世界的理解能力等方面实现大幅提升。
依托极佳科技的核心团队,这支由来自清华大学、中国科学院、中国科学技术大学等顶尖学府的专业人士组成,累计发表了逾200篇AI领域顶级论文,多次摘得全球权威AI竞赛的桂冠。这不仅是技术实力的象征,也是其在AI研究与应用领域深厚积累的体现。
本文内容由快科技提供,所刊载的所有内容(包括但不限于文字、图片、LOGO、音频、视频、软件、程序等)均受版权保护。如发现任何单位或个人认为其中的内容可能涉嫌侵犯其知识产权或存在不实内容,欢迎及时告知,以便采取相应措施,感谢合作。