OpenAI牵头 AMD、NVIDIA、Intel、微软、博通巨头罕见联手 搞定AI网络层
市场快讯
2026-05-07 11:58:00
0
金色财经报道,5月7日,据快科技,OpenAI今日通过开放计算项目(OCP)正式发布MRC(多路径可靠连接)协议,解决大规模AI训练中的GPU网络通信瓶颈。该协议由OpenAI与AMD、NVIDIA、Intel、微软和博通历时两年联合开发,目前已在搭载NVIDIA GB200的超算集群中投入实际使用。
MRC要解决的核心问题是:在训练大规模AI模型时,单次数据传输延迟就足以导致整个训练过程中断,GPU集体空转等待,而集群规模越大,由网络拥塞、链路和设备故障引发的延迟问题越频繁。MRC的方案是将...
金色财经报道,5月7日,据快科技,OpenAI今日通过开放计算项目(OCP)正式发布MRC(多路径可靠连接)协议,解决大规模AI训练中的GPU网络通信瓶颈。该协议由OpenAI与AMD、NVIDIA、Intel、微软和博通历时两年联合开发,目前已在搭载NVIDIA GB200的超算集群中投入实际使用。
MRC要解决的核心问题是:在训练大规模AI模型时,单次数据传输延迟就足以导致整个训练过程中断,GPU集体空转等待,而集群规模越大,由网络拥塞、链路和设备故障引发的延迟问题越频繁。MRC的方案是将单条800Gb/s网络接口拆分为多条更小的链路,例如将一个接口连接至8台不同交换机,构建8条独立的100Gb/s并行网络,而非依赖单一800Gb/s网络。
文章版权声明:除非注明,否则均为本站 原创文章,转载或复制请以超链接形式并注明出处