腾讯云在大模型领域的战略布局持续完善,近期宣布推出AI原生向量数据库Tencent Cloud VectorDB,该产品将以独立产品的形式正式上线腾讯云平台,预计于八月上架。此举措标志着腾讯云在大模型平台基础上,进一步针对大模型对海量数据的需求,提供了专门的云服务产品,成为国内首个在云市场中提供此类服务的云服务商。
随着今年大模型趋势的兴起,向量数据库因其独特的功能特性,受到了行业的广泛关注。它们作为大模型的“长期记忆”,能够显著加速知识更新速度、降低训练成本、保护数据隐私,并减少模型产生的幻觉。在腾讯云推出的行业大模型平台上,向量数据库被视为核心能力之一。
向量数据库通过将数据转化为向量进行存储和查询,具备高效处理大规模复杂数据及高维数据(如图像、音视频)的能力,同时支持复杂的查询操作,并能轻松扩展至多节点以处理更大的数据量。以腾讯云向量数据库为例,它最高可支持10亿级向量检索规模,检索延迟控制在毫秒级,较传统插件式数据库的检索规模提升10倍,同时具备百万级每秒查询(QPS)的峰值能力。
腾讯云数据库副总经理罗云指出,腾讯云向量数据库在接入层、计算层、存储层全面实现了AI化的解决方案,使得用户在使用过程中能持续应用AI能力。具体而言:
借助腾讯云向量数据库,企业接入大模型所需时间从原来的1个月缩短至3天,同时相比传统方式,大模型预训练数据的分类、去重和清洗效率提升了10倍,成本降低了2-4个数量级。
面对今年大模型趋势的发展,腾讯云敏锐洞察了向量数据库市场的潜力与需求。内部讨论后,腾讯云认为单独的向量数据库产品能更好地满足市场对于高效、稳定的数据处理服务的需求。AI原生开发范式的引入,旨在提供更为精细的资源管理,降低成本的同时,优化性能和效率。
腾讯云具备优势的原因在于其深厚的技术积累和对市场需求的精准把握:
Olama引擎:腾讯云向量数据库依托的分布式向量数据库引擎Olama(原名ElasticFaiss),在处理腾讯集团每日千亿次检索时表现出色,数据接入AI的效率提升10倍,运行稳定性达99.99%,并在MS MARCO榜单上取得第一,相关成果发表于NLP顶级会议ACL。
外因:考虑到国内企业对数据稳定性的高度重视,腾讯云在提供自有的技术服务方面具有较强竞争力。东北证券预测,至2030年,全球向量数据库市场规模有望达到500亿美元,国内市场规模预计将超过600亿人民币。
综上所述,腾讯云推出AI原生向量数据库不仅顺应了大模型领域的发展趋势,还体现了其在数据服务领域的技术实力与市场洞察力。随着大模型趋势的持续升温,向量数据库作为关键基础设施的角色愈发凸显,腾讯云的这一举动无疑将进一步强化其在云计算市场的领先地位。