马斯克 xAI 推出 Grok-1.5 大语言模型
作者头像
  • 童琪
  • 2024-03-29 00:00:00 3058

人工智能领域新突破:xAI发布升级版Grok-1.5大语言模型

发布日期: 2023年3月29日

xAI,马斯克领导的人工智能公司,今日在其官方博客上宣布,正式推出了Grok-1.5大语言模型,此款模型在推理能力与上下文处理上实现显著提升。

核心特点

  • 增强的推理能力128k上下文长度,尤其在编码和数学任务上的表现尤为出色。
  • 平台推出计划:预计在未来几天内,Grok-1.5将首先向前期测试参与者及现有Grok用户开放。

性能亮点

  • 数学基准测试:在MATH和GSM8K测试中分别获得50.6%和90%的成绩,涵盖从小学到高中级别的竞赛问题。
  • 代码生成与问题解决:在HumanEval测试中的得分高达74.1%,显示了其在代码生成和问题解决方面的强大能力。

长上下文理解

  • 支持长达128k tokens的长文本处理,相较于前代模型,内存容量扩大16倍,能更有效地理解和整合长文档信息。

技术架构

  • 自定义分布式训练框架,依托于JAX、Rust和Kubernetes构建,采用自定义训练协调器,具备自动检测并排除故障节点的能力。
  • 引入优化的检查点、数据加载和训练作业重启机制,大幅减少因故障导致的停机时间。

来源图灵汇


此版本的Grok-1.5不仅在功能上实现了显著的提升,而且在技术创新上展现出独特的策略,旨在提供更高效、更全面的语言模型解决方案。随着其在特定领域内的卓越表现,Grok-1.5有望成为推动人工智能技术发展的重要力量。

    本文来源:IT之家
责任编辑: : 童琪
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
马斯克模型语言推出GrokxAI1.5
    下一篇