近期,CPO(相干光平台)概念在国内外资本市场的热度显著攀升。专业光通信市场资讯机构LightCounting针对Photonics West会议期间举办的CPO论坛上所讨论的关键议题进行了深度解析。
LightCounting观察到,尽管光通信技术并非Photonics West会议的焦点,但CPO论坛提出的一个关键问题引发了广泛思考——若网络能耗仅占云数据中心总能耗的2%至3%,为何还对光模块能耗的增加感到担忧?
Vipul Bhat,来自Coherent公司,依据一篇发表于科学期刊的论文,分享了关于数据中心能耗增长被高估的观点。这份研究对比了2010年与2018年全球所有数据中心的能耗变化,发现增长幅度约为8%。以此趋势预测至2022年至2023年,由于数据中心能效持续提升,预计总能耗将温和增长2%至3%。
能效提升的原因主要包括:企业工作负载逐渐转移至由云服务提供商运营的超大规模数据中心,这些数据中心的能效更高;服务器与存储设备的能效亦在稳步提高,这两类设备是能耗的主要来源。
LightCounting指出,2012年网络能耗仅占云数据中心总能耗的1%,至2018年升至2%,预计到2022年将接近3%。对于这样的增长,是否值得忧虑?
根据LightCounting的分析,2018年至2022年间,部署在云数据中心的光模块总能耗约为330兆瓦或1.2万亿瓦时,约占当前云数据中心总能耗的1%。然而,预计到2028年,这一数字将攀升至超过8%。此外,分析还揭示了可插拔光模块能耗效率的显著提升:从100G光模块的每比特35皮焦耳降至800G光模块的每比特20皮焦耳。
展望未来,到2028年,云数据中心的光模块能耗预计将占据总能耗的8%,这是否应引起关注?
LightCounting回应道,确实应当引起关注。云计算服务提供商面临着为基础设施提供额外电力等资源的重大限制。如果光学系统消耗更多资源,他们可能不得不削减分配给服务器和存储设备的预算。
与此同时,人工智能集群的设计受限于光连接的高能耗与成本。NVIDIA声称,若无能耗与成本限制,他们现在可以使用32倍数量的光学器件。AI模型训练需要庞大的GPU阵列,供应商若能降低能耗与成本,高带宽光连接将是最佳解决方案。
下一代CPO设计由Ayar Labs、Broadcom、IBM和Ranovus共同推动,预期能达到每比特2皮焦耳至3皮焦耳的能耗效率。Rajeev Ram教授,Photonics West全体会议发言人兼Ayar Labs联合创始人,声称现有技术在每通道200G时能实现0.1皮焦耳的能耗效率。他的研究团队正在麻省理工学院探索低电压调制器与改进探测器,目标是将互连能耗降至0.001皮焦耳或更低。
麻省理工学院的研究方案则侧重于利用极低的数据速率(Mbps级别)来降低能耗。Ayar Labs的方法采用较低速度(64吉比特/秒)的非归零(NRZ)光器件,期望达到每比特2皮焦耳的能耗效率。在通道112G NRZ下的1皮焦耳/比特以下能耗是否可行,仍待验证。
LightCounting总结称,行业正面临抉择:维持现状,逐步改进可插拔光模块技术,人工智能集群规模扩张速度不会过快;或者承担风险,研发新光学技术,采用新型封装与光纤耦合设计,实现成本与能耗效率的全面优化。后者虽极具挑战性,但错过这一机遇将带来损失。LightCounting强调,当前业界热议的CPO技术挑战主要集中在封装与低损耗光纤连接等方面。