张量并行 (TP):
极度消耗带宽!必须绝对锁死在 Scale-up 域(单机)的 NVLink 高速公路内。如果跨机器,龟速网络会瞬间拖垮整个集群。
极度消耗带宽!必须绝对锁死在 Scale-up 域(单机)的 NVLink 高速公路内。如果跨机器,龟速网络会瞬间拖垮整个集群。
Scale-out 域 (跨机器 InfiniBand 网络)
Node 1 (NVLink)
GPU 0
GPU 1
GPU 2
GPU 3
Node 2 (NVLink)
GPU 4
GPU 5
GPU 6
GPU 7
Node 3 (NVLink)
GPU 8
GPU 9
GPU 10
GPU 11
Node 4 (NVLink)
GPU 12
GPU 13
GPU 14
GPU 15