近期,昆仑万维公司重磅推出了其AI音乐领域的创新成果——“天工SkyMusic”大型AI音乐创作模型,并宣布启动了一场面向专业人士的免费体验活动。此活动旨在与媒体人士、行业分析师及音乐制作爱好者一同探索这款代表了声音情感表达尖端技术的音乐产品。
自活动上线以来,“天工SkyMusic”AI音乐创作模型广受关注,昆仑万维团队短时间内收到了数以十万计的体验申请。申请者中不乏专业音乐制作者、媒体人士、行业分析师,以及热衷于音乐创作的爱好者们。
用户反馈热烈,对“天工SkyMusic”的表现给予了高度评价:
用户的热情参与和积极反馈凸显了行业对“天工SkyMusic”的期待,同时也彰显了在情感AI研究领域中,情感AI的重要性。
音频作为理解人类情感的最佳媒介,音乐作为一种跨越地域和文化的表达形式,始终以其独特的方式传递情感与慰藉。这就是“天工SkyMusic”致力于创造音乐愿景的初心,也是昆仑万维在情感AI领域不懈追求的目标。
对积极参与和提供宝贵反馈的用户,我们深表感激。我们将持续优化“天工SkyMusic”,拓展其多模态情感理解与表达能力,为用户提供卓越的AI音乐体验。
未来,我们计划发布“天工SkyMusic”的音乐创作提示指南,分享AI音乐Demo及使用技巧,与用户一同探索AI音乐的魅力。
关于“天工SkyMusic”与“天工3.0”
“天工SkyMusic”是基于昆仑万维的“天工3.0”超级大模型开发的AI音乐生成系统。预计4月17日,“天工SkyMusic”将与“天工3.0”一起开放测试。
“天工3.0”采用4千亿参数的MoE混合专家模型,计划开源。它在语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习能力方面均有显著提升,较上一代“天工2.0”,技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。此外,“天工3.0”还增加了搜索增强、研究模式、调用代码及绘制图表、多次调用联网搜索功能,并专门训练了模型的Agent能力,使其能够独立规划、调用、整合外部工具及信息,高效完成产业分析、产品对比等复杂任务,为用户提供前所未有的AI体验。
“天工SkyMusic”是目前唯一公开可用的AI音乐生成大模型,采用音乐音频领域的Sora模型架构,由Large-scale Transformer负责谱曲,学习Music Patches的上下文依赖,实现音乐的可控性;由Diffusion Transformer负责演唱,通过LDM将Music Patches还原为高质量音频,支持生成80秒44100Hz采样率的双声道立体声歌曲。该模型架构在视频、音频和音乐领域表现出色。昆仑万维团队将持续迭代和增强模型能力,以实现更强的多模态情感理解和表达。