发布时间:2024-12-11 | 阅读:
2月9日晚间,国家市场监督管理总局依法对英伟达公司开展反垄断立案调查的消息引发广泛关注。此次调查主要是由于2019年英伟达收购以色列高速网络互联设备厂商迈络思(Mellanox)引发。分析当时市场监督管理总局要求英伟达、迈络思和集中后实体履行的5条公开义务,其核心在于迈络思RDMA产品与英伟达GPU 不得强制捆绑产品,必须允许混合组网,并依据公平、合理、无歧视原则继续供应相关产品。
反垄断调查的核心:RDMA混合组网
2019年 3 月 10 日,英伟达以 69 亿美元的巨额资金将以色列迈络思科技有限公司纳入麾下,使其成为全资子公司。
根据《反垄断法》以及相关规定,即使并购案的双方都是外国公司,但只要他们的年收入在全球超过100亿元人民币,在中国市场超过4亿元人民币,那么相关收购案就将会被纳入中国商务部的监管当中。
英伟达在GPU芯片领域独占鳌头,在2019年的营收已达到117.2亿美元。迈络思作为一家在全球范围内为服务器和存储提供端到端Infiniband和以太网互联解决方案的领军企业,其2015年在全球InfiniBand市场上的占有率达到80%。中国作为全世界最大的市场之一,英伟达和迈络思在中国有大量的业务。这一收购案无疑需要被中国反垄断部门监管。
2019年4月24日,国家市场监督管理总局收到上述收购的经营者集中反垄断申报。2020年4月,国家市场监督管理总局依法附加限制性条件批准英伟达收购迈络思。
根据申报方提交的附加限制性条件承诺方案,市场监督管理总局要求英伟达、迈络思和集中后实体履行如下义务:
1.向中国市场销售英伟达 GPU 加速器与迈络思高速网络互联设备时,不得以任何方式强制进行搭售,或者附加任何其他不合理的交易条件;不得阻碍或限制客户单独购买或使用上述产品;不得在服务水平、价格、软件功能等方面歧视单独购买上述产品的客户。
2.依据公平、合理、无歧视原则向中国市场继续供应英伟达 GPU 加速器、迈络思高速网络互联设备和相关软件、配件。
3.继续保证英伟达 GPU 加速器与第三方网络互联设备、迈络思高速网络互联设备与第三方加速器的互操作性。
4.继续保持迈络思高速网络互联设备点对点通信软件和集合通信软件的开源承诺。
5.对第三方加速器和网络互联设备制造商的信息采取保护措施。
英伟达在收购迈络思后,涉嫌并未完全履行附加的限制性条件,特别是在中国市场上的销售行为可能涉及捆绑销售和歧视性定价等垄断行为。市场监管总局此次立案调查,正是为了打破这种可能的垄断局面,促进市场竞争,保护消费者权益。
允许混合组网,即允许其GPU加速器和迈络思高速网络互联设备与其他厂商的产品进行兼容和互操作。不仅有助于维护市场公平竞争,也为国产RDMA技术厂商公平公正参与市场竞争提供了友好环境。柏睿数据RDMA解决方案正是基于混合组网的理念,不仅支持RDMA技术,还能够利用原有的TCP网络,实现了技术的兼容性和灵活性。这种方案不仅提高了数据传输的速度和效率,还降低了对特定硬件的依赖,为用户提供了更多的选择和便利。
RDMA/RoCE与迈络思InfinityBand
RDMA技术包含多种协议,其中InfiniBand、iWARP和RDMA over Converged Ethernet(RoCE)是三种主要的协议。
InfiniBand(简称 IB),直译过来就是“无限带宽”。IB是一种专为高性能计算(HPC)和数据中心设计的网络互联技术,其率先引入了RDMA协议。
上世纪90年代,业界普遍认为一些更强大的计算机正在接近PCI(电脑中的设备互连标准)总线的瓶颈。IB技术也是被设计用来替代内部PCI总线和外部以太网络。康柏、戴尔、惠普、IBM、Intel、微软、Sun等180多家IT巨头共同发起成立InfiniBand行业协会(IBTA),研究新的替代技术来取代PCl,解决PCI总线传输瓶颈的问题。在2000年,InfiniBand架构规范的1.0版本正式发布。
大量初创公司随之涌现,其中就包括以色列的迈络思。其由几名前英特尔公司和伽利略公司员工于1999年创建。2001年他们推出了自己的首款InfiniBand产品。
进入 21 世纪以来,随着云计算、大数据的不断普及,数据中心获得了高速发展。而 InfiniBand作为数据中心里的一项关键技术高歌猛进,市场份额不断提升。Mellanox凭借将IB用于高性能计算、端到端设备等重大战略决策,逐渐成为了InfiniBand市场的领导者。
IB虽然可以提供最佳性能,但自定义了从链路层到传输层的整套规范,需要专用网卡和交换机支持,不兼容以太网且价格昂贵。
面对IB的迅猛发展,以太网也在积极应对。2010年4月,IBTA发布了RoCE技术,即基于融合以太网的远程直接内存访问,将InfiniBand中的RDMA技术移植到了以太网上。2014年,RoCE v2版本发布,使以太网大幅缩小了与InfiniBand之间的技术性能差距。
RoCE消耗很少的CPU负载,在数据中心桥接以太网中利用优先流控制(PFC)来达到网络的无损连接。由于RoCE与现有以太网设备的兼容性,这些解决方案也更容易被用户接受和部署。
最新的统计数据显示,使用RoCE方案可以将TCO(总拥有成本)降低超过50%,并且能够支持100万张GPU的扩展能力,而IB方案则只能支持48000张GPU。这种高扩展性使得以太网RDMA成为支撑未来大规模AI集群的理想选择。
柏睿RDMA迎来发展机遇
英伟达在中国遭遇反垄断调查维护了市场公平竞争原则。随着RoCE技术的不断发展,国产RDMA迎来了难得的发展机遇。柏睿数据的RDMA技术基于RoCE协议,支持混合组网,兼容现有以太网设备,为客户AI基础设施提供灵活、经济、高效的技术支持。
柏睿数据通过将RDMA封装成Socket接口,使得开发人员可以使用熟悉的Socket编程模型,而无需直接处理RDMA的复杂性。这一创新简化了RDMA的应用门槛,可以更容易地与现有的应用程序和系统集成,提高了可移植性、兼容性和易维护性。近期在一个大规模 400G RoCE 集群测试结果显示,使用柏睿 RDMA Socket 可以大大提升网络响应速度和带宽传送能力。
柏睿数据将RDMA技术与全内存分布式计算引擎相结合。RDMA进行的数据传输,有效支持不同计算节点之间的快速协作;全内存分布式计算则可以确保数据在多个节点之间的共享和快速处理,极大提高了数据传输的速度和效率,在高性能工业仿真等领域发挥出巨大作用。
随着AIGC大模型应用落地,各行业对高性能计算和智能计算的需求井喷,RDMA技术正在成为AI网络架构中的重要支柱。数据中心中已安装的以太网交换机端口数量超过了4亿个。鉴于其广泛的存在,以太网将在AI/ML网络中发挥越来越大的作用,未来会有越来越多的RDMA操作通过以太网完成。柏睿数据将继续加大在RDMA技术研发和应用落地方面的投入,推出更多具有竞争力的产品和解决方案,为用户提供更加高效、便捷的数据传输服务。