基于容器的共享CPU和透传CPU两个方式的性能差异如何,在GPU要求较高的进程中如何选型,如何在容器平台同时使用这种方案,满足容器的自动调度能力?
收起感觉问题应该是透传GPU和共享GPU的性能差异吧
首先透传和共享都是基于虚拟化层实现的一种技术手段,相比来说透传会比共享性能更优异,但是利用率会比较低,尤其是较大规模的平台,如果是在较大规模的容器平台,在裸金属的环境下,可以参考GPU Operator的方式调度和管理GPU,同时支持MIG空分和vGPU时分的方式,可以理解同时支持直通和共享的模式,GPU Operator是一个容器平台的插件,包含在NVIDIA AI Enterprise软件套件中。