MIG

与MPS一样，NVIDIA多实例GPU（MIG）促进了每个GPU的共享，但对资源进行了严格的分区。它非常适合在多个不同的用户之间共享GPU，因为每个MIG实例都有一组有保证的资源，并且是完全隔离的。

GPU在选定的NVIDIA安培体系结构MIG上可用，包括A100，每个GPU最多支持七个MIG实例。MIG可以与MPS组合，其中多个MPS客户端可以在每个MIG实例上同时运行，每个物理GPU最多支持48个MPS客户端。

虽然可以跨多个MIG实例运行单个应用程序实例，例如使用MPI，MIG的目标并不是为该用例提供任何性能改进。MIG的主要目的是在每个GPU上促进多个不同的应用程序实例。

图1 GPU模拟吞吐量

图1显示了RNAse（左）和ADH（右）在8- GPU DGX A100服务器上同时运行的所有模拟中，每个GPU的模拟次数对总综合吞吐量（以ns/天为单位，越高越好）的影响。每种情况下最左边的结果（每个GPU进行一次模拟）仅比相应的单独模拟结果（前面给出）乘以8（DGX A100服务器上GPU的数量）低几个百分点。这表明您可以在服务器上有效地运行多个模拟，而不会产生明显的干扰。

父主题： 多GPU优化