11月 08
  1. 今天
  2. 星期五
55:00
grade

在人工智能生成式时代,图形处理器(GPU)的重要性不言而喻。英伟达与AMD作为行业巨头,在硬件和软件领域展开了激烈的竞争。

英伟达,作为GPU的代表,占据了PC GPU市场的主导地位,其出货量远超AMD。英伟达深知其硬件与生成式AI之间的紧密联系,致力于通过工具和应用拓展市场。英伟达为获取其硬件设定了较低门槛,如CUDA工具包和cuDNN优化库等,使其在硬件领域以外还拥有强大的软件护城河。

尽管AMD与英伟达之间存在显著差异,但AMD正逐步扩大市场份额。市场调研数据显示,AMD在GPU市场上的表现虽不及英伟达,但其正在努力缩小差距。

英伟达的软件工程师团队规模庞大,这使得其在软件开发方面具有显著优势。CUDA虽未开源,但英伟达提供了免费服务,并严格控制其使用,这为希望在高性能计算(HPC)和生成式AI市场上抢占份额的公司和用户带来了挑战。

生成式AI的基础模型数量持续增长,许多模型是开源的,可供自由使用和共享。然而,构建这些模型需要大量的资源,尤其是大型企业如AWS、微软Azure、谷歌云、Meta等,它们拥有大量GPU资源。其他公司也纷纷购入GPU以构建自己的基础模型。

研究领域中,这些模型展现了广泛的应用潜力,包括微调和推理任务。微调是指将特定领域的数据融入基础模型,使其适应特定场景;推理则是在微调后实际执行任务,这都需要加速计算的支持,即GPU的参与。

英伟达的GPU因其在加速计算方面的出色表现而成为首选。AMD通过HIP(类CUDA)转换工具,为用户提供了一种替代方案,使其能够使用AMD GPU运行大量模型和工具。

PyTorch已成为生成式AI领域的重要工具,作为开源机器学习库,它专注于神经网络深度学习模型的开发和训练。PyTorch的普及程度显著,据Ryan O'Connor的博客显示,HuggingFace网站上92%的可用模型仅支持PyTorch。此外,机器学习论文的比较也反映出放弃TensorFlow转向PyTorch的趋势。

AMD的Instinct MI300A处理器旨在与英伟达的Grace-Hopper超级芯片竞争,这款集成了Zen4核心和CDNA 3 GPU架构的处理器,配备了高达192GB的HBM3内存,提供统一的内存访问,减少了CPU和GPU间的数据移动,提高了性能和能效。

随着生成式AI市场的不断发展,硬件的竞争将围绕性能、可移植性和可用性等多维度展开。AMD通过放下围绕基础模型的CUDA护城河的吊桥,为其在推理市场上的领先地位做好了准备。未来,生成式AI硬件市场的赢家仍未揭晓,竞争将更加激烈。