司南OpenCompass 2.0评测GLM-4稳坐国内榜首，智谱AI大模型实力强悍

翟辰绪
2024-05-22 00:00:00 3013

近期，由上海人工智能实验室发布的大型模型开源开放评测体系司南（OpenCompass 2.0）发布了2024年4月的大型语言模型评测排行榜。在这份榜单中，智谱AI的GLM-4稳居国产大模型榜首，展现出了强劲的领先地位。

评测体系以全面、高质量的方式对超过150个主流开源模型和商业API模型进行了评估，构建了一个包含语言、知识、推理、数学、代码、智能体等六个维度的评测框架，共计设计了15000余道中英文双语问题。评测结果表明，GLM-4在多个关键指标上表现出色，尤其是在语言和知识领域，分别取得了57.7分和68.9分的高分，超越了包括Meta、阿里巴巴、腾讯、百度在内的多家国内外企业及科研机构的同类模型。

GLM-4作为智谱AI今年1月推出的新型基座大模型，其性能接近国际顶级模型GPT-4，具备处理更长文本序列、支持多模态任务和加快推理速度的能力。借助于GLM-4 All Tools功能，模型能根据用户需求，自动执行复杂指令，集成网页浏览器、代码解析器及图像生成等功能，有效完成多样化任务。

开发者可通过智谱AI大模型开放平台bigmodel.cn轻松获取GLM-4的API服务，从而体验到其强大的功能。此次评测不仅巩固了GLM-4在国内大型语言模型领域的领先地位，也展现了中国在大模型研发领域的实力。

图灵汇

责任编辑：：翟辰绪

声明：本文系图灵汇原创稿件，版权属图灵汇所有，未经授权不得转载，已经协议授权的媒体下载使用时须注明"稿件来源：图灵汇"，违者将依法追究责任。

司南榜首强悍 OpenCompass 模型评测实力国内 GLM 2.0

苏腾毅

2024-05-22

XREAL 新品发布会前瞻：行业猜测主打视觉体验