2023年9月6日,于北京举行的百川智能大模型发布会中,百川智能正式推出了Baichuan2开源大模型。这一里程碑事件标志着Baichuan2在腾AI基础软硬件平台上的全面支持,并在思MindSpore开源社区大模型平台上提供了Baichuan2-7B模型的开放体验。
发布会现场,百川智能宣布Baichuan2-7B、Baichuan2-13B及其量化版本4bit面向全球学术及商业市场开放,提供大模型服务,所有模型均提供免费的商用许可。这一步旨在促进模型的广泛使用与创新应用。
Baichuan2-7B-Base和Baichuan2-13B-Base模型在数学、代码、安全、逻辑推理和语义理解方面展现出了显著提升,相较于上一代模型,其性能大幅提升。其中,Baichuan2-13B-Base在数学能力、代码能力、安全能力、逻辑推理能力和语义理解能力上的提升分别达到了49%、46%、37%、25%和15%。
这两款模型在多个权威评测榜单上表现出色,特别是在MMLU、CMMLU、GSM8K等评估基准中,Baichuan2-7B-Base以70亿参数量在英文主流任务上与130亿参数量的LLaMA 2基本持平,展现了其在性能上的巨大优势。
Baichuan2-7B和Baichuan2-13B不仅为学术研究提供了强大的工具,也为开发者提供了免费的商用许可。只需通过邮件申请,开发者即可享受到这些模型带来的便利与创新潜能。
Baichuan2大模型作为百川智能开发的一系列开源可商用的大规模预训练语言模型,包含了从70亿到530亿参数的不同规模模型。百川智能自成立以来,始终致力于通过开源模式推动中国模型生态的发展与繁荣。此次推出的两款Baichuan2模型得到了业界的热烈响应,众多知名企业如华为等均参与了发布会,并与百川智能建立了合作关系。
腾AI作为构建于腾AI基础软硬件平台之上的AI计算产业,集成了Atlas系列硬件、异构计算架构CANN、全场景AI框架MindSpore、腾应用使能MindX、一站式开发平台ModelArts和统一工具链MindStudio等组件,为开发者提供了一站式的AI开发环境与支持。
Baichuan2开源大模型的发布,不仅标志着中国在人工智能领域的又一重要突破,也为全球开发者和学术研究者提供了强大而灵活的工具。通过与腾AI的紧密合作,百川智能进一步推动了AI技术的普及与创新,开启了人工智能应用的新篇章。