AnalyticDB 搭载 AMD 性价比提升30%
作者头像
  • 田燕妮
  • 2024-05-28 00:00:00 3021

概述

阿里云原生数仓 AnalyticDB for PostgreSQL 与 AMD 新一代硬件紧密集成,通过自主研发的计算引擎及行列混合存储架构,实现了性能的显著提升,整体性能提升了30%。此数仓解决方案旨在帮助企业构建一体化的离线在线、流批处理综合分析平台,采用单一引擎支持离线批处理、流式加工与交互式分析场景,展现出在开发运维、响应速度及成本效益上的优势。

硬件架构优化

芯片性能提升

AMD与阿里云共同研发的新一代硬件采用CIPU架构,搭载AMD EPYC Genoa处理器,提供稳定的计算输出与增强的I/O能力,同时强化了芯片级别的安全性。第四代EPYC相较于前代在关键性能指标上实现了显著增长,针对分析型数据库的核心痛点进行了优化,包括高计算力、高内存带宽与低延迟,以助于提升数据仓库与在线分析场景的性能。

计算能效提升

新一代服务器在保持核心数量不变的情况下,整数性能提升约24%,浮点性能提升约52%。这一优化意味着使用较少的服务器即可完成等量工作,或是在同等服务器规模下执行更多任务,显著提高了计算效率。

安全性和隔离性提升

第四代AMD EPYC支持安全内存加密(SME)和安全加密虚拟化(SEV),通过将内存与持有它的线程关联,有效抵御旁路攻击。同时,增加了SEV中的加密上下文数量,支持更多的安全虚拟机。此外,通过安全加密状态(SEV-ES)保护虚拟机状态不受恶意或受损管理程序的影响,并新增了安全嵌套分页(SEV-SNP)功能,以防止数据重放、内存重映射等攻击。

数据库内核优化

全自研计算引擎

AnalyticDB for PostgreSQL的全自研计算引擎通过一系列技术创新,显著加快了数据处理与交互式分析的速度:

  • 芯片向量化技术:利用SIMD指令集等技术,最大化利用芯片的并行计算能力。
  • LLVM JIT动态编译优化:加速计算,提高数据处理效率。
  • 自适应内存模型:动态选择行存/列存内存模型,以适应不同计算模式。
  • 加速典型场景:针对Runtime Filter、Join分析、低基数字段计算等场景提供优化方案。

全自研行列混存

一份存储即可支持实时高吞吐写入/更新与实时高聚合分析,实现高效查询性能。通过Write Optimized Part高效承接批量/流式数据,并通过内部Optimize优化,转化为Read Optimized Part,以提升查询效率。利用Metadata实现高并发Update/Delete操作。

测试结果

性能测试采用国际标准TPC-H测试集,对比搭载AMD EPYC Genoa服务器的实验组与同等规格的主流硬件对照组,AnalyticDB for PostgreSQL平均性能提升了32.7%。

优势及应用场景

  • 离在线一体分析:提供稳定高效的离线批处理与高性能在线报表分析能力,减少数据不一致与提升时效性。
  • 海外数仓平滑迁移:全面兼容Greenplum/Redshift/Synapse/Snowflake等海外云数仓产品的语法,加强了安全能力、资源隔离与容灾功能,实现性能与功能上的超越。
  • 流批一体实时数仓:支持流批任务的细粒度资源隔离,能够消费Kafka/Flink/DTS实时数据源,实现高吞吐流式数据写入与实时多表关联分析,满足实时报表分析与下游应用系统的高时效性需求。

开启方式

新购实例应优先开启AMD形态。在选择地域时,建议用户考虑“北京、上海、杭州、深圳”等地区以优化实例性能。

    本文来源:图灵汇
责任编辑: : 田燕妮
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
搭载AnalyticDB性价比提升AMD30
    下一篇