最近,360集团的智脑团队推出了两款新模型——Light-R1 14B和7B推理模型。在数学和科学推理测试中,14B模型的表现远超DeepSeek发布的同级别产品,并且整体性能超越了目前市场上的同类模型,甚至接近DeepSeek R1 32B版本的水平。业内人士指出,这两款模型的发布有助于推动大模型在本地设备上的应用,促进大模型的广泛普及。
根据权威测试数据,Light-R1 14B在数学方面的表现达到了DeepSeek 671B满血版的92%,而在推理和科学知识方面也达到了其86%的能力。这意味着,尽管14B模型的参数量仅为DeepSeek R1满血版的极小部分,但在某些领域已经能够展现出接近90%的核心功能。此外,7B模型在数学能力上相当于DeepSeek 70B蒸馏版的84%,在科学知识和推理方面则达到了其75%的水平。
目前,许多政企机构在使用DeepSeek满血版时遇到数据安全的问题,他们既希望模型能更好地适应企业需求,又担心核心数据会外泄。因此,本地化部署成为很多政企用户的迫切需求。然而,运行DeepSeek R1 6710亿参数满血版的成本非常高,通常需要几十万到上百万元,这极大限制了大模型的本地化应用。
自从360智脑的14B和7B模型开放源代码后,无论是政企单位还是个人用户,都可以利用普通的硬件设备完成部署。比如,英伟达3060显卡可以顺畅运行7B模型,价格大约一千多元;而售价约六千多元的3090显卡则支持14B模型的运行。这意味着,过去需要花费数千万元才能部署的大模型,现在只需几千元即可完成。预计随着更多小参数大模型的开源,大模型的私有化部署将更加普及,中小企业和个人用户也能以较低的成本获得高性能的推理模型。
对于政企组织来说,他们对大模型的需求各不相同,既要快速响应,又要与自身的知识库对接,并且要确保数据的安全性和成本的可控性。一旦企业采用360智脑的14B和7B模型,就能让大模型的能力覆盖到各个部门乃至小组,满足不同场景下的具体需求。
从个人用户的角度来看,只要拥有一台普通的家用电脑以及一块适合游戏的显卡,就能够在家安装14B或7B模型。用户可以根据自己的需要,将这些模型应用于学习和工作之中。
360集团的创始人周鸿祎提到:“我们期望14B和7B模型能够走进千家万户,融入各行各业,使每个人都能拥有属于自己的强大人工智能助手,从而推动中国人工智能的普及化进程。”
另外,了解到360智脑计划推出更多参数配置的大模型,为用户提供更多的本地部署选项。(古雨)