发布时间:2024-12-19 | 阅读:
近日,市场监管总局对全球芯片巨头英伟达开展反垄断调查持续吸引业界关注。核心在于迈络思RDMA产品与英伟达GPU不得强制捆绑,必须允许混合组网。同时,近年来国产GPU在性能、功能和应用领域等方面都有了提升,逐渐赢得了市场的认可和用户的信任。这为国产RDMA技术发展和市场格局带来深远影响,拉开国产GPU与RDMA技术的混合组网时代的大幕。
柏睿数据作为领先的智能数据算力基础设施提供商,持续加大高性能RDMA技术的创新和应用探索,目前推出小规模、中大规模两种RoCE组网方案。柏睿RoCE组网方案在国产GPU32台集群(256卡)的混合组网中表现出色。这一成果不仅验证了柏睿数据在高性能计算领域的强大实力,更为国产替代方案提供了有力支持。
RDMA即远程直接内存访问技术,是一种革命性的网络通信方式。它允许用户程序直接与网络接口卡(NIC)交互,绕过操作系统内核及CPU,实现高效、低延迟的数据传输。
RoCE则是在以太网基础设备上实现RDMA的技术,降低了成本并简化了部署。柏睿RoCE提供了最通用的TCP Socket编程接口,使得RDMA技术的实现更加快速和便捷。它能够更容易地与现有的应用程序和系统集成,提高了可移植性、兼容性和易维护性。
柏睿数据的RoCE组网方案以其灵活性和高效性著称。该方案支持国产GPU与RDMA技术的混合组网,打破了国外技术垄断,可以帮助用户构建不同规模、灵活、可靠、高品质的低时延RoCE网络,为AI基础设施提供了全新的组网选择和灵活、经济、高效的技术支持。
柏睿RoCE中大规模组网中,国产GPU服务器采用多轨接入方式,通过Leaf-Spine网络架构实现高效的数据传输。GPU 服务器按交换机可连服务器数量分组,同组内的 GPU 服务器上相同序号的参数网网卡连接到同一台 Leaf 交换机上。少数需要跨轨通信的场景,通过交换机互通。
例如,Leaf 交换机可以连接 32 台GPU,则可以将 32 台服务器分为一组,每个服务器上安装8 个参数网网卡,每个服务器上的第 n 台参数网网卡连接到第 n 台交换机上。这种组网方式的优势是流量聚合、高可靠性、低延迟和简化了网络规划,GPU集群能够轻松应对大规模的计算任务。
小规模组网建议使用单盒或单框方案, GPU 服务器的所有参数网网卡均与交换机互联,并针对不同服务器同序号的网卡配置到相同VLAN 中,减少通信跳数及通信时延。
柏睿数据的RDMA组网方案在成本上也具有显著优势。与传统的InfiniBand组网相比,柏睿数据的RoCE组网方案能够大幅降低组网成本,同时提供相当甚至更优的性能表现。在100Gbps速率下的柏睿RoCE组网方案相比InfiniBand组网方案节省约36%;400Gbps速率下则能达到大约14.3%的成本节约。这使得更多的企业机构能够承担得起高性能计算集群的建设和运营成本,推动了人工智能和高性能计算的普及和发展。
网络规划作为链接各类设备的“桥梁”,对于智算中心整体性能发挥至关重要。柏睿RoCE混合组网方案将成为满足这一需求的重要选择。未来,柏睿数据将进一步扩展智算集群组网规模,通过持续的技术创新与能效优化在AI基础设施领域持续跟进,为更复杂的AI任务提供强大的支持。