在11月25日至26日举办的全球数据商业大会上,来自世界各地的专家、企业和机构齐聚上海,共襄盛举。大会亮点包括一场开幕仪式、一场主旨论坛、一场数据交易节日以及20个聚焦不同主题的研讨会。其中,11月26日举行的“数据要素市场与大模型语料库论坛”特别值得关注,该论坛由上海数据交易所、星环信息科技(上海)股份有限公司主办,上海市数商协会协办。超过200家专注于大模型数据、人工智能技术以及相关领域的企业和机构代表参会。
上海市经济信息化委员会信息化推进处处长钱晓在致辞中强调,当前阶段,高质量的语料数据对于大模型的发展至关重要。为此,上海经信委于11月发布了《上海市推动人工智能大模型创新发展若干措施》,提出了11项具体措施,旨在推动预训练模型的创新发展,加强创新能力,优化创新要素供给,促进大模型的应用,并构建一流创新环境。今年,上海还成立了中国大模型语料数据联盟,旨在整合模型训练、数据提供、学术研究、第三方服务等资源,构建国际化、开放性的大模型语料数据生态系统。
在此次活动中,上海市新能源汽车公共数据采集与监测研究中心、华院计算技术(上海)股份有限公司、星环信息科技(上海)股份有限公司、上海市人工智能行业协会、上海稀宇科技有限公司等12家新成员加入中国大模型语料数据联盟,为大模型技术的深度发展与高水平应用提供了更加多元的数据要素保障。上海人工智能实验室生态中心负责人、合作交流与知识产权部部长王宇,人民网上海频道总经理金煜纯为新成员颁发了入盟纪念证书。
为促进大模型技术的快速发展,三家单位联合发布了专业数据集,涵盖上海统计年鉴数据集、中国家谱总目数据集和国际仲裁法律、规则与实践数据集,丰富了数据模态。面对数据爆炸式增长带来的安全与隐私保护挑战,上海人工智能实验室和人民网共同发起成立中国大模型语料数据联盟安全治理专委会,致力于推动大模型数据安全治理,保障技术创新。
活动期间,上海人工智能实验室生态中心负责人王宇、人民网上海频道总经理金煜纯,以及上海人工智能实验室治理研究中心副主任王迎春分别就《构建高质量的大模型语料数据生态》、人工智能治理及《生成式人工智能——合规性评估与语料库建设》进行了深入探讨。
与会者还听取了来自金融、科技、媒体等多个领域的专家关于大模型时代的见解,如星环科技联合创始人刘汪根、中金计算机首席分析师于钟海、上海数据交易所市场发展部副总经理章健、交通银行软件开发中心综合业务产品部副处长姚利虎、科大讯飞AI工程院副院长刘坤、上海财联社技术总监叶周的精彩演讲。此外,星环科技智能量化事业部总经理曾晨光主持的“中国大模型语料库的价值与挑战”圆桌对话,邀请了主管机构、学界、数据机构和交易所的代表,共同探讨了中国大模型语料库建设的关键议题。
全球数据商业大会不仅展示了当前大模型领域的最新进展,也强调了数据治理的重要性。未来,中国大模型语料数据联盟将继续凝聚各方力量,共享资源,充分发挥各成员单位的优势,共同推动大模型语料数据的高水平供给,为中国大模型产业的持续发展提供坚实的数据基础。