司南OpenCompass 2.0评测GLM-4稳坐国内榜首,智谱AI大模型实力强悍
作者头像
  • 翟辰绪
  • 2024-05-22 00:00:00 3013

近期,由上海人工智能实验室发布的大型模型开源开放评测体系司南(OpenCompass 2.0)发布了2024年4月的大型语言模型评测排行榜。在这份榜单中,智谱AI的GLM-4稳居国产大模型榜首,展现出了强劲的领先地位。

评测体系以全面、高质量的方式对超过150个主流开源模型和商业API模型进行了评估,构建了一个包含语言、知识、推理、数学、代码、智能体等六个维度的评测框架,共计设计了15000余道中英文双语问题。评测结果表明,GLM-4在多个关键指标上表现出色,尤其是在语言和知识领域,分别取得了57.7分和68.9分的高分,超越了包括Meta、阿里巴巴、腾讯、百度在内的多家国内外企业及科研机构的同类模型。

GLM-4作为智谱AI今年1月推出的新型基座大模型,其性能接近国际顶级模型GPT-4,具备处理更长文本序列、支持多模态任务和加快推理速度的能力。借助于GLM-4 All Tools功能,模型能根据用户需求,自动执行复杂指令,集成网页浏览器、代码解析器及图像生成等功能,有效完成多样化任务。

开发者可通过智谱AI大模型开放平台bigmodel.cn轻松获取GLM-4的API服务,从而体验到其强大的功能。此次评测不仅巩固了GLM-4在国内大型语言模型领域的领先地位,也展现了中国在大模型研发领域的实力。

    本文来源:图灵汇
责任编辑: : 翟辰绪
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
司南榜首强悍OpenCompass模型评测实力国内GLM2.0
    下一篇