人类历史上的每一次转折都蕴含着进步的契机。SARS推动了电子商务等数字经济的发展,而新冠肺炎疫情则加速了新一轮的数字化转型。
在医药健康领域,数据的价值如同黄金一般珍贵,但由于“信息孤岛”的限制,这些宝贵的资源难以被挖掘和共享。
最近,中关村医药健康大数据交易平台在北京正式成立,通过这个平台,“信息孤岛”有望被打破,实现医院、制药企业和科研机构之间数据的有效流通。
作为共建方之一,中关村生命科学园还将提供实际应用场景的支持。
今年是中关村生命科学园成立20周年。近日,在中关村生命科学园联合北京市大数据中心举办的“2020全球医药健康大数据峰会”上,如何利用大数据、人工智能及区块链等新技术基础设施来改造传统医药健康产业,成为了与会专家讨论的热点话题。
海量数据的涌现
今年的新冠肺炎疫情是中国近年来遭遇的最严重的公共卫生事件。在抗击疫情的过程中,大数据成为了一种强有力的工具。
专家们发现,大数据及其分析平台在多个方面有着广泛的应用,如智能城市监控、密切接触者追踪和疫苗开发等。
在整个疫情防控期间,密切接触者追踪已经成为一种被广泛认可的数字解决方案。一旦有人核酸检测结果呈阳性,其所有接触者都会收到通知。
这些数据不仅能够识别潜在的病毒携带者,还能识别出高感染率地区,从而帮助各国政府制定针对特定区域的防控措施。
中国疾病预防控制中心全球公共卫生中心副主任戚晓鹏表示,通过收集各个领域的关键真实数据,并运用机器学习方法对风险因素进行综合分析,可以改进整个SEIR(易感者、潜伏者、感染者、康复人群)传播动力学模型。
实际上,除了疫情期间收集的大数据外,医药健康领域内医院内外的数据已经呈现出爆发式增长。
以生物医药大数据为例,它涵盖了生物医药研发数据、临床医学服务数据和健康医疗相关产业数据三个方面。例如,电子病历、基因数据、影像数据以及可穿戴设备产生的日常行为数据等。
据估计,一张X光片的数据量约为几十MB,一个CT扫描可达100MB,一份标准病理图像接近5GB。按国内医院数量约3万家计算,每年新增的数据总量将达到60PB至1EB。
这些影像数据不仅需要保存至少30年,还必须具备冗余保护机制和数据备份机制,以抵御计算机病毒等攻击。
在疫苗开发领域,人工智能和大数据平台的结合显著提升了数据挖掘能力,从而识别已获官方批准的用于治疗类似病毒的药物,同时也能帮助发现新的药物分子,利用数据库辅助科学家更快地开发疫苗。
此外,基于数字化技术的真实世界研究可以从大数据中提取有价值的生物标志物,帮助药品更精准地锁定有效人群,从而提高治疗效果。
面临的挑战
事实上,医药健康大数据是一个跨领域、高速增长的新兴行业,涉及范围极其广泛,数据标准化难度极大,这也是该行业面临的主要障碍之一。
“中国有超过1000家信息技术供应商,各自的标准差异巨大。仅从命名上看,一堆字母就像天书,如果没有统一标准,根本无法理解它们。医生的书写方式也是千差万别,比如糖尿病的诊断名称就有200多种不同的写法。”阿里健康集团智慧医疗大数据运营总监裴云飞说。
个体差异大、疾病种类繁多、复合疾病常见、关系复杂、医学检查和治疗手段不断发展、新疾病不断产生和变化,个人信息不足、信息不对称等因素,都使得医药健康大数据难以标准化,从而形成“信息孤岛”。
上海有孚网络股份有限公司执行副总裁吕鑫认为,这些快速增长且庞大的数据背后,数据管理、计算分析、数据传输、安全合规等方面都存在很多问题。
例如,数据存储成本高昂、查找效率低下、计算需求波动大、流程迁移困难、传输效率低、数据共享难、安全加固系统部署复杂、数据可控性差、数据加密困难等。
更值得关注的是,由于公共卫生投入未必能直接产生经济效益,因此该领域往往不受重视。
对此,戚晓鹏指出,公共卫生领域实际上可以产生一些间接效益。她呼吁大数据公司和学者更加关注该领域大数据的应用,特别是预防医学,一些重要的预测分析工作可以向该领域倾斜。
此外,用户隐私也是医药健康大数据无法回避的问题。如何通过新技术手段,在保障用户隐私的同时充分释放数据价值,也是行业内必须面对的挑战。
平台的构建
为了更好地推动医药健康大数据的应用和发展,中关村医药健康大数据交易平台将围绕大数据和医疗健康两大战略性新兴产业展开探索,拓展医疗健康智能化应用领域。
“平台实现了数据孤岛的打通,构建了一个开放的技术架构,基于区块链的智能合约为多方合作带来了便利,并使得交易和技术服务更加便捷。”清华大学北京信息科学技术国家研究中心研究员尹浩介绍说。
未来,该交易平台将汇聚医疗、软件系统开发、硬件设备研发制造、科研机构等全产业链要素,推动全国乃至全球医药健康行业的创新发展。
在平台的运营机制中,北京市大数据中心负责数据管理和交易监管;中关村科学城管委会负责特色创新平台的建设;中国技术交易所负责交易系统的管理和流程优化;清华大学信息科学技术国家研究中心负责核心技术与区块链平台的维护;中关村生命科学园则提供典型应用场景的落地支持。此外,北京市经济和信息化局将对平台进行政策和产业引导。
北京市大数据中心副主任石志国表示,北京大数据中心提供了大量“新基建”背景下的数据资产,并在此基础上构建了政务大数据应用和医药健康相关应用,为企业提供各种服务。
“我们希望构建一个基于主要大企业的生态系统项目,如阿里健康、腾讯医疗和百度健康等医疗集团,带动整个北京地区的医疗健康大数据生态系统建设。在大企业基础上,孵化中小企业,打造中小企业百花齐放的创新局面。”石志国说。