10月11日,上海人工智能实验室公布了一项重大技术突破,推出了首个图文混合创作大模型——“书生·浦语灵笔”(InternLM-XComposer),并宣布了其源代码的开源计划。这一创新成果同步上线于GitHub、Hugging Face以及魔搭社区,旨在促进AI技术在图文创作领域的广泛交流与应用。
“书生·浦语灵笔”基于“书生·浦语”大语言模型,展现出了强大的多模态能力,能够接收视觉与语言信息,实现一键生成图文融合内容的高效创作。该模型的推出,标志着AI在内容创作领域迈出了重要一步。
为了评估“浦语灵笔”的实际表现,研究团队采用了五大主流多模态大模型评测标准,包括MME Benchmark、MMBench、MMBench-CN、Seed-Bench、以及CCBench。这些评测覆盖了从感知到认知的多个维度,全面展示了模型在处理多模态数据时的出色性能。
“浦语灵笔”不仅提供了开源版本,包括智能创作与对话(InternLM-XComposer-7B)以及多任务预训练(InternLM-XComposer-VL-7B),还承诺了免费商用政策,为开发者和企业提供更多可能性。
此次发布的“书生·浦语灵笔”不仅体现了上海人工智能实验室在AI技术领域的持续创新,也为图文创作领域带来了全新的解决方案。随着其源代码的开放,预计将在全球范围内激发更多创意与合作,推动AI技术在内容产业的应用与发展。