MIG
与MPS一样,NVIDIA多实例GPU(MIG)促进了每个GPU的共享,但对资源进行了严格的分区。它非常适合在多个不同的用户之间共享GPU,因为每个MIG实例都有一组有保证的资源,并且是完全隔离的。
GPU在选定的NVIDIA安培体系结构MIG上可用,包括A100,每个GPU最多支持七个MIG实例。MIG可以与MPS组合,其中多个MPS客户端可以在每个MIG实例上同时运行,每个物理GPU最多支持48个MPS客户端。
虽然可以跨多个MIG实例运行单个应用程序实例,例如使用MPI,MIG的目标并不是为该用例提供任何性能改进。MIG的主要目的是在每个GPU上促进多个不同的应用程序实例。
图1显示了RNAse(左)和ADH(右)在8- GPU DGX A100服务器上同时运行的所有模拟中,每个GPU的模拟次数对总综合吞吐量(以ns/天为单位,越高越好)的影响。每种情况下最左边的结果(每个GPU进行一次模拟)仅比相应的单独模拟结果(前面给出)乘以8(DGX A100服务器上GPU的数量)低几个百分点。这表明您可以在服务器上有效地运行多个模拟,而不会产生明显的干扰。
父主题: 多GPU优化