在近期的科技动态中,上海人工智能实验室宣布发布了一套名为“司南2.0”的大模型开源开放评测体系。此体系旨在全面评估大模型在知识、语言、理解、推理以及考试能力等五大维度上的表现,为大模型技术创新提供了坚实的依据。
在发布的评测榜单中,GPT-4 Turbo以其卓越的性能,在各项测试中脱颖而出,荣获最佳表现。紧随其后的是智谱AI的新一代基座大模型GLM-4,该模型在榜单中位居第二,显示出其在中文场景下的强大竞争力。上海人工智能实验室指出,在中文环境下,国内的模型展现出显著的优势,且与GPT-4 Turbo的水平接近。
“司南2.0”评测涵盖了超过150个大语言模型和多模态大模型,吸引了来自全球的众多企业和科研机构参与,包括Meta、阿里巴巴、腾讯、百度等。这一评测体系不仅推动了技术创新,还促进了跨领域的交流合作。
智谱AI在2024年度技术开放日上推出了其新一代基座大模型GLM-4,该模型在整体性能上取得了显著提升,接近GPT-4的水平。GLM-4具有更长的上下文支持、更强的多模态能力,以及更快的推理速度和更高的并发支持,有效降低了推理成本。此外,GLM-4实现了智能体能力的大幅增强,能够自主理解并执行复杂的指令,通过调用网页浏览器、代码解释器和多模态文生图模型来完成任务。同时,智谱AI还上线了GLMs个性化智能体定制功能,允许用户通过简单的提示词指令创建专属的智能体。
为了使更多开发者能够便捷高效地体验GLM-4的强大能力,智谱AI开放了GLM-4模型的API接口。所有开发者均可通过智谱AI的开放平台获取API服务,探索和利用GLM-4的创新功能。
智谱AI的CEO张鹏强调,实现国产全自研、自主可控的强大人工智能基础模型已成为科技竞争的关键。自2020年底启动GLM预训练架构的研发以来,智谱AI始终坚持自主研发道路,不断推陈出新。GLM-4作为智谱AI的最新成果,代表了公司在大模型创新领域的持续努力。智谱AI致力于与中国人工智能产业的所有参与者、合作伙伴、开发者社区及学术界携手共进,共同推动中国人工智能产业的发展。
智谱AI自成立以来,专注于打造新一代认知智能大模型,致力于推动中国大模型的创新发展。从2020年底开始研发GLM预训练架构,到2021年训练完成百亿参数模型GLM-10B,再到利用MoE架构成功训练出万亿稀疏模型,智谱AI在大模型领域不断突破。2022年,智谱AI合作研发了中英双语千亿级超大规模预训练模型GLM-130B。2023年,智谱AI推出了基于千亿基座的对话模型ChatGLM,并开源了单卡版模型ChatGLM-6B,为研究者和个人开发者提供了本地微调和部署的可能性。
通过构建完整的大模型生态系统和提供全流程技术支持,智谱AI旨在连接物理世界中的亿级用户,为各行各业带来持续的创新与变革,加速推进通用人工智能时代的到来。智谱AI致力于成为推动中国人工智能产业发展的关键力量,与整个行业共同探索未来的无限可能。