您的位置: 首页 >商业新闻 >

英伟达推出新的HGX A100系统

2021-12-27 09:40:20 编辑:郝士菡 来源:

[page]今天,NVIDIA 宣布在其一些全球合作伙伴的帮助下,将推出新的 NVIDIA HGX A100 系统。新系统希望通过添加 NVIDIA 元素(例如 NVIDIA A100 80GB PCIe GPU、NVIDIA NDR 400G InfiniBand 网络和 NVIDIA Magnum IO GPUDirect Storage 软件)来加速 AI 和 HPC。这些新的 HGX 系统将由 Atos、Dell Technologies、Hewlett Packard Enterprise (HPE)、联想、Microsoft Azure 和 NetApp 等合作伙伴推向市场。

NVIDIA 多年来一直在制造高性能 GPU。新兴的人工智能市场,尤其是高性能计算市场,已经推动越来越多的超级计算机利用公司的技术。过去几年,NVIDIA 自己一直在使用 DGX 和 HGX 型号制造 HPC 服务器和工作站。后者将多个 NVIDIA IP 集中在一个屋檐下以提高性能 新系统再次使用 NVIDIA 提供的最新和最出色的产品来做到这一点。

英伟达 A100 80GB PCIe GPU

NVIDIA A100 于去年在 GTC 上发布。这款新的 7 纳米 GPU 利用该公司的 Ampere 架构并包含 5400 万个晶体管。随着 NVIDIA A100 80GB PCIe GPU 的推出,NVIDIA 迅速改进了产品,使其内存翻了一番。A100 80GB PCIe GPU 是新 HGX A100 系统的第一部分。其大内存容量和高带宽允许在内存中保存更多数据和更大的神经网络。这意味着更少的节点间通信以及更少的能源消耗。高内存还允许更高的吞吐量,这可以导致更快的结果。

如前所述,NVIDIA A100 80GB PCIe GPU 由该公司的 Ampere 架构提供支持。此架构具有多实例 GPU,也称为 MIG。MIG 可以为较小的工作负载提供加速,即 AI 推理。此功能允许用户在保证 QoS 的情况下缩减计算和内存。

围绕 NVIDIA A100 80GB PCIe GPU 的合作伙伴包括 Atos、Cisco、Dell Technologies、富士通、H3C、HPE、浪潮、联想、企鹅计算、QCT 和 Supermicro。有一些云服务也提供该技术,包括 AWS、Azure 和 Oracle。

NVIDIA HGX A100 系统难题的第二个部分是新的 NVIDIA NDR 400G InfiniBand 交换机系统。这听起来有点明显,但 HPC 系统需要非常高的数据吞吐量。几年前,NVIDIA 以近 70 亿美元的价格收购了 Mellanox。从那时起,它一直在稳步发布新产品,同时慢慢地为 NVIDIA 逐步淘汰 Mellanox 名称。去年发布了 NVIDIA NDR 400G InfiniBand,端口密度提高了 3 倍,AI 加速提高了 32 倍。这将通过 NVIDIA Quantum-2 固定配置开关系统集成到新的 HGX 系统中。据说该系统每个端口提供 64 个 NDR 400Gb/s InfiniBand 端口或 128 个 NDR200 端口。

据该公司称,新的 NVIDIA Quantum-2 模块化交换机可提供高达 2,048 个 NDR 400Gb/s InfiniBand 端口(或 4,096 个 NDR200 端口)的可扩展端口配置,双向总吞吐量为每秒 1.64 PB。与上一代相比,性能提高了 5 倍以上,可扩展性提高了 6.5 倍。使用 DragonFly+ 网络拓扑,用户可以连接到超过一百万个节点。最后,该公司添加了其第三代 NVIDIA SHARP 网络计算数据缩减技术,并声称与前几代相比,该技术可以实现 32 倍的 AI 加速。

NVIDIA Quantum-2 交换机向后和向前兼容。制造合作伙伴包括 Atos、DDN、Dell Technologies、Excelero、GIGABYTE、HPE、联想、企鹅、QCT、Supermicro、VAST 和 WekaIO。

Magnum IO GPUDirect 存储

新的 NVIDIA HDX A100 难题的最后一块是新的 Magnum IO GPUDirect Storage。这允许在 GPU 内存和存储之间直接访问内存。这有几个好处,包括更低的 I/O 延迟、大量使用网络适配器的带宽以及对 CPU 的影响较小。多家合作伙伴现已提供 Magnum IO GPUDirect Storage,包括 DDN、Dell Technologies、Excelero、HPE、IBM Storage、Micron、NetApp、Pavilion、ScaleFlux、VAST 和 WekaIO。


郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

最新文章

Copyright 平安财经网 All Rights Reserved 版权所有 复制必究 联系QQ280 715 8082   备案号:闽ICP备19027007号-6

本站除标明“本站原创”外所有信息均转载自互联网 版权归原作者所有。