高新区——“数典工程”建设初见成效 收录大数据术语两万余条
作者头像
  • 飞机圈子
  • 2020-06-09 15:06:11 1

记者从贵阳高新区中电科大数据研究院有限公司了解到,该公司的“数典工程”研发团队已经取得了一定的阶段性成果,收录的大数据术语已超过两万条,构建的数据模型也达到了两百个。

“数典工程”旨在创建一个大数据领域的术语词典,类似于常用的新华字典,它是一种基础工具,用以规范大数据技术的发展与应用。“数典工程”的重要性在于,随着数据要素逐渐成为推动数字经济发展的关键因素,由于大数据发展过程中存在的标准化不足的问题,数典工程有助于更好地指导大数据的规范化进程。

“数典”概念最早于2019年的数博会期间提出,同年5月,贵阳高新区中电科大数据研究院有限公司正式启动了“数典”项目,针对数据释义和内容格式不统一、数据标准难以统一等问题,提出了打造中国最大规模的数据基础资源汇聚平台的目标——数典工程。该项目秉持“工具化、平台化、开放化”的理念,建立了以数典理论为基础、以大数据词典为核心、以数典平台为载体、以标准化规范为保障,并扩展多项数据服务的“3+3+N”体系架构。

经过研发团队近一年的努力,目前围绕数据领域模型构建的大数据“语言体系”已经初具雏形,其中包含两万多条与“大数据+行业应用”相关的术语,以及大约两百个数据模型和五十多个公安、检务等特定行业领域的描述模型。

刘汪洋博士表示,“数典工程”能够有效地解决数据标准化定义、统一标识、系统分类及数据融合应用等问题,从而避免数据“难用、滥用、混用”等现象的发生。“数典工程”不仅是一个承前启后的基础性项目,而且对于巩固大数据成果、引导大数据的规范化发展具有重要意义。

    本文来源:图灵汇
责任编辑: : 飞机圈子
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
余条初见成效两万高新区术语收录数据建设工程
    下一篇