中科闻歌+华为云 :高质量打造数据平台底座 推动大模型赋能产业
作者头像
  • 钟燕文
  • 2024-06-23 00:00:00 2786

探索大模型驱动的人工智能革新与数智化应用的未来

华为开发者大会2024:中科闻歌的创新实践

在6月22日举办的华为开发者大会2024(HDC 2024)上,中科闻歌的技术副总盘浩军先生受邀参与,围绕《基于Data4AI打造高质量数据平台底座》这一主题,与会者深入探讨了基于数据集构建大模型的实际操作与创新方向。

中科闻歌:人工智能的科技先锋

中科闻歌,作为中国科学院自动化研究所孵化的人工智能公司,专注于复杂数据解析与AI辅助决策。通过与华为云的紧密合作,中科闻歌在云服务的支持下,构建了认知与决策智能的基础平台DIOS和雅意大模型,推动了人工智能技术的飞跃发展,全面助力行业的数字化与智能化转型。

数据工程:构建高质量数据治理体系

在数据工程领域,中科闻歌致力于解决大模型训练所需数据质量的关键问题。通过使用高质量数据清理工具,他们对原始数据进行深度处理,包括文档数据去重、标准化、启发式清理、段落及句子去重和“毒性”过滤等步骤,确保数据安全可控且符合高质量标准。多语言语料库的丰富性增强了模型在多语言场景下的理解和分析能力,为大模型提供了坚实的数据基础。

模型工程:打造灵活多样的模型体系

在模型工程层面,中科闻歌提出采用“1+N+MoE”的策略,即构建一个基座模型确保自主可控,同时引入多种领域模型以汲取不同领域的智慧,形成多专家模型。其自主研发的雅意大模型,作为国产安全可靠的大模型代表,具备国产自主可控、丰富的数据集积累、生态开源开放、垂直领域知识增强等特性,能够提供多语言理解、多模态内容生成、多智能体辅助决策的核心能力。该模型2.0版本已拥有全自主知识产权,支持行业应用场景的自定义训练和微调,兼容多种国产算力硬件,为政府与企业提供安全可靠的AI解决方案。

领域工程:AI赋能多元应用场景

中科闻歌展示了雅意大模型在金融、媒体、安全等领域的真实应用案例,如银行财报问答、航天信息财税大模型、深圳市龙华政务问答GPT、中医科学院国医金匮智能问诊等。这些应用证明了大模型在实际场景中的强大潜力和广泛适用性。

未来展望:聚焦通用人工智能与轻量化模型

中科闻歌将目光投向通用人工智能的前沿技术,目标是从语义理解迈向世界理解,从感知智能向认知和决策智能的跨越。在模型选择上,他们强调了效率与成本的平衡,倡导构建更高效、更经济的轻量化行业专用模型,旨在提供更高性价比的AI解决方案。

随着AI应用的日益丰富和大模型的迭代更新,计算需求正持续增长,“大模型+大算力+大数据”成为了新一代人工智能发展的关键模式。中科闻歌将持续与华为云及其他合作伙伴合作,利用国产算力资源,构建高质量的数据平台底座,共同推动大模型行业生态的繁荣发展,加速大模型在各行业的落地应用。

    本文来源:图灵汇
责任编辑: : 钟燕文
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
华为底座中科高质量模型推动产业打造数据平台
    下一篇