4月15日,可灵AI在北京举办了一场主题为“灵感成真”的2.0模型发布会,宣布其核心模型进行了新一轮升级。这次升级主要集中在两个方面:视频生成领域的可灵2.0模型和图像生成领域的可图2.0模型。
自2024年6月推出以来,可灵AI已经完成了超过20次的技术更新。目前,该平台在全球范围内吸引了超过2200万名注册用户,覆盖了150多个国家和地区的企业和开发者。这些开发者利用可灵AI的API技术,将其应用到各种行业场景中。
可灵AI全系列模型的这次升级,重新定义了人与AI之间的交互模式。发布会上提到,此次升级的重点在于提升模型的基础性能。可灵2.0模型在动态表现、语义理解和视觉美感等多个关键技术指标上达到了行业顶尖水平;而可图2.0模型则在指令执行的准确性以及艺术风格的表现上有了显著进步。内部评估显示,这两款模型在文字相关性和画面清晰度等关键维度上相较前一代产品都有了明显改进。
自去年6月发布以来,可灵AI已经累计完成了超过20次迭代。在最近的一次排名中,全球知名的AI基准测试机构Artificial Analysis公布的最新全球视频生成大模型榜单中,快手可灵1.6pro(高品质模式)凭借1000分的Arena ELO基准测试评分,在图生视频赛道排名第一。
截至目前,可灵AI的全球用户总数已突破2200万,累计生成了1.68亿个视频和3.44亿张图片素材。从上线至今的十个月内,其月活跃用户数增长了25倍。
在发布会上,快手高级副总裁盖坤指出,虽然AI在辅助创意表达方面展现出巨大潜力,但当前行业发展仍面临诸多挑战,尤其是在内容稳定性和复杂创意的精准传达方面。因此,要实现“用AI讲述每个精彩故事”的目标,必须全面提升基模型的能力,重新定义人与AI交互的语言。
一直以来,可灵AI都在努力提升模型的基础质量和效果,并不断引入创新功能以满足用户多样化的需求。在这次2.0模型的迭代中,可灵AI推出了AI视频生成的新交互理念——Multi-modal Visual Language(MVL)。这种模式通过整合文本指令与多模态参考素材(如图像、视频片段),帮助用户更精准地表达创作意图。盖坤强调:“仅靠文字描述很难完全展现影像信息,我们需要构建一种更高效的人机交互语言。”
基于这一理念开发的编辑工具允许用户通过图文混合输入来操作视频内容,比如增加、删除或修改元素。现场演示表明,系统能够快速解析用户提供的参考图,并完成复杂的编辑任务,例如场景替换和角色调整。
发布会上,快手副总裁兼可灵AI负责人张迪展示了可灵2.0大师版,这款产品在语义响应、动态质量和画面美学等方面实现了显著提升。张迪提到,可灵2.0大师版不仅是一次技术上的改进,更是用户体验的一次飞跃。“它在技术、体验和美学三个方面都取得了突破。”
此外,可灵2.0大师版增强了视频和图像创作的可控生成与编辑能力,新增了多模态视频编辑功能,使系统能够更好地理解用户意图。用户可以在已有视频的基础上,通过输入图片或文字,对视频内容进行元素的增删改操作,从而实现更加灵活的二次编辑。
张迪还透露,目前大约85%的可灵AI视频创作来源于图生视频,而图片质量对视频生成效果至关重要。在图像生成方面,可图2.0也迎来了全面升级,包括大幅提升指令遵循能力、增强电影美学表现力以及丰富多元的艺术风格。在风格化处理上,可图2.0支持60多种风格化效果,模型的创意和想象力得到了大幅提升。
与此同时,可图2.0还推出了实用的图像可控编辑功能,如局部重绘和扩图,允许用户对图片进行增加、修改和修复。在多模态可控生成中,可图2.0上线了全新的风格转绘功能,只需上传一张图片并添加风格描述,即可一键转换图片的艺术风格,同时保持原图语义内容的精准还原。
可灵AI通过AIGC技术为各行业的发展注入了新的活力。除了面向普通用户,可灵AI还为企业客户提供API接入服务。目前,可灵AI已与包括小米、亚马逊云科技、阿里云、Freepik、蓝色光标在内的数千家国内外企业建立了合作关系,为广告营销、专业创作、影视制作、娱乐创意等领域提供技术支持。
盖坤提到,全球范围内已有超过1.5万名开发者将可灵AI的API应用于不同场景中,累计生成了约1200万张图像和超过4000万个视频素材。二次元创作平台狸谱的负责人一休表示,接入可灵AI后,平台的动态效果处理能力显著提高,近期推出的“新春萌偶摇”活动获得了60万次传播。
可灵AI的超级创作者、《新世界加载中》总导演、异类Outliers创始人陈翔宇分享了在影视制作中的实践经验:“与传统拍摄相比,AIGC技术极大地拓展了创作的可能性。我们已经完成了首部全程依靠AI生成的剧集级作品,证明了其在工业化生产中的可行性。”
为了激励更多AI爱好者的创造力,快手副总裁兼可灵AI负责人张迪发起了“可灵AI NextGen 新影像创投计划”。该计划将通过千万资金投入、全球宣发、IP打造和保障等手段,以全资出品、联合出品和技术支持等多种形式,支持AIGC创作者,让更多优秀的AI故事走向世界。同时,可灵AI向全球创作者发出邀请,共同打造全球首支用户共创的AI创意短片,并将其展示在上海、香港、东京、巴黎、多伦多等地的广告大屏上。
展望未来,盖坤表示,可灵AI将继续大力推动技术创新,通过人与AI交互的全新语言,帮助用户实现复杂创意的精确表达。“我们的目标是让每个人都能用AI讲述精彩的故事,也希望这一天早日到来。”