数据管理的重要性
随着数据量的迅速增长,高功能计算(HPC)、大数据(BD)和机器学习(ML)之间的融合日益加深。数据生成已经不再是主要问题,而是如何更好地管理和分析数据。
未来计算系统的演变
由于半导体技术的进步逐渐放缓,未来的计算系统将更加多样化。为了满足低延迟的需求,系统需要具备更高的灵活性。同时,由于可信数据稀缺,需要新的工具和标准来解决HPC模拟、大数据和机器学习中遇到的问题。
计算生态系统的变革
未来的计算生态系统将整合边缘计算、云计算和高功能计算。为实现这一目标,需要开发新的编程算法、语言编译器、操作系统和运行时系统。预计“边缘智能计算”的重要性将进一步提升,它涉及在网络边缘进行智能数据收集和分类。
跨领域合作的必要性
HPC、BD和ML社区需要加强合作,以推动生态系统的发展,更好地服务这三大领域。虽然数据分析和HPC模拟已经在一定程度上融合,但由于技术和组织的差异,两个领域的软件生态系统仍有待完善。
美国能源部和国立卫生研究院合作在国家癌症研究所开展的“癌症分布式学习环境”项目,致力于汇集分子、药物反应和治疗策略的数据,以提高癌症治疗效果。不同领域的专家团队利用不同规模和模型的数据,开发了一个综合的深度神经网络,用于解决这三个领域的挑战。
能源部联合产业界和学术界共同实施的“面向气候分析的百亿次深度学习”项目,利用能源部的“顶点”超级计算机,通过训练好的深度学习模型识别极端天气模式。研究团队开发了一种创新的卷积分割架构,可以自动提取寒带气旋等极端天气的特征,有助于气候科学界预测未来类似事件的频率和强度。该项目还荣获了2018年的戈登贝尔奖。
模拟和数据分析都需要强大的计算能力。随着硬件异构性的增加,系统性能也将提升。主要的硬件挑战包括互连效率、创新工具、能耗、集成内存、可扩展文件系统、可靠网络和平衡的硬件开发等。
过去,大型实验主要依赖本地计算资源进行数据分析。现在,越来越多的研究转向HPC以获得实时结果。同样,部分机器学习和深度学习的应用也需要借助HPC资源进行训练。模拟的规模和复杂性需要一个能够处理复杂工作流程并利用机器学习自动化的系统。主要的运作模式挑战包括可扩展工具、新用户培训、新数据工具和服务等。
现代HPC系统能够将模拟预测功能与机器学习的分析和优化功能有效结合。随着深度神经网络在机器学习中的广泛应用,数据分析也具备了传统HPC工作负载的计算特性。为了突破计算性能扩展的限制,系统将继续采用GPU等加速器。主要的软件挑战包括系统设计、边缘计算或边缘智能计算、系统管理、通用软件库等。
Oracle高级技术总监精心制作的一套完整课程体系,全面助力大数据开发。无论你是零基础还是进阶提升,这套课程都能助你成为大数据开发高手,迈向高薪职业。
获取方式如下:
祝大家学习愉快!请务必认真对待这些教程,并多多练习。