智谱AI新一代基座大模型GLM-4在司南评测中跻身前列，位居国内第一

赵春孟
2024-02-04 00:00:00 3006

上海人工智能实验室发布大模型评测体系“司南2.0”，揭示2023年度大模型排名

在近期的科技动态中，上海人工智能实验室宣布发布了一套名为“司南2.0”的大模型开源开放评测体系。此体系旨在全面评估大模型在知识、语言、理解、推理以及考试能力等五大维度上的表现，为大模型技术创新提供了坚实的依据。

在发布的评测榜单中，GPT-4 Turbo以其卓越的性能，在各项测试中脱颖而出，荣获最佳表现。紧随其后的是智谱AI的新一代基座大模型GLM-4，该模型在榜单中位居第二，显示出其在中文场景下的强大竞争力。上海人工智能实验室指出，在中文环境下，国内的模型展现出显著的优势，且与GPT-4 Turbo的水平接近。

“司南2.0”评测涵盖了超过150个大语言模型和多模态大模型，吸引了来自全球的众多企业和科研机构参与，包括Meta、阿里巴巴、腾讯、百度等。这一评测体系不仅推动了技术创新，还促进了跨领域的交流合作。

智谱AI发布GLM-4，引领大模型技术创新

智谱AI在2024年度技术开放日上推出了其新一代基座大模型GLM-4，该模型在整体性能上取得了显著提升，接近GPT-4的水平。GLM-4具有更长的上下文支持、更强的多模态能力，以及更快的推理速度和更高的并发支持，有效降低了推理成本。此外，GLM-4实现了智能体能力的大幅增强，能够自主理解并执行复杂的指令，通过调用网页浏览器、代码解释器和多模态文生图模型来完成任务。同时，智谱AI还上线了GLMs个性化智能体定制功能，允许用户通过简单的提示词指令创建专属的智能体。

GLM-4开放API正式上线，赋能开发者

为了使更多开发者能够便捷高效地体验GLM-4的强大能力，智谱AI开放了GLM-4模型的API接口。所有开发者均可通过智谱AI的开放平台获取API服务，探索和利用GLM-4的创新功能。

智谱AI的使命与愿景

智谱AI的CEO张鹏强调，实现国产全自研、自主可控的强大人工智能基础模型已成为科技竞争的关键。自2020年底启动GLM预训练架构的研发以来，智谱AI始终坚持自主研发道路，不断推陈出新。GLM-4作为智谱AI的最新成果，代表了公司在大模型创新领域的持续努力。智谱AI致力于与中国人工智能产业的所有参与者、合作伙伴、开发者社区及学术界携手共进，共同推动中国人工智能产业的发展。

智谱AI的成长历程与成就

智谱AI自成立以来，专注于打造新一代认知智能大模型，致力于推动中国大模型的创新发展。从2020年底开始研发GLM预训练架构，到2021年训练完成百亿参数模型GLM-10B，再到利用MoE架构成功训练出万亿稀疏模型，智谱AI在大模型领域不断突破。2022年，智谱AI合作研发了中英双语千亿级超大规模预训练模型GLM-130B。2023年，智谱AI推出了基于千亿基座的对话模型ChatGLM，并开源了单卡版模型ChatGLM-6B，为研究者和个人开发者提供了本地微调和部署的可能性。