基于容器的共享CPU和透传CPU性能的差异有多大?

基于容器的共享CPU和透传CPU两个方式的性能差异如何,在GPU要求较高的进程中如何选型,如何在容器平台同时使用这种方案,满足容器的自动调度能力?

参与5

2同行回答

罗文江罗文江课题专家组云计算架构师某银行
在容器云环境共享GPU,如果是物理机部署K8S集群的模式,则可以直接使用K8S的GPU虚拟化技术: vCUDA或者cGPU,就可以实现了在容器POD实例中高效稳定运行GPU显示。容器环境中GPU资源池中是不可以同时使用多种切分方式的。每种GPU虚拟化的实现方式不同,且对GPU卡资源的排斥性管理的...显示全部
  1. 在容器云环境共享GPU,如果是物理机部署K8S集群的模式,则可以直接使用K8S的GPU虚拟化技术: vCUDA或者cGPU,就可以实现了在容器POD实例中高效稳定运行GPU显示。
  2. 容器环境中GPU资源池中是不可以同时使用多种切分方式的。每种GPU虚拟化的实现方式不同,且对GPU卡资源的排斥性管理的。 当前GPU虚拟化技术的效果能够做到一虚十,即粒度到0.1GPU。
  3. GPU透传(或称直通模式,GPU Passthrough )则是指将GPU在虚拟化平台透传到客户虚拟机的技术。
收起
银行 · 2022-05-02
浏览745
感觉问题应该是透传GPU和共享GPU的性能差异吧首先透传和共享都是基于虚拟化层实现的一种技术手段,相比来说透传会比共享性能更优异,但是利用率会比较低,尤其是较大规模的平台,如果是在较大规模的容器平台,在裸金属的环境下,可以参考GPU Operator的方式调度和管理GPU,同时支持MI...显示全部

感觉问题应该是透传GPU和共享GPU的性能差异吧

首先透传和共享都是基于虚拟化层实现的一种技术手段,相比来说透传会比共享性能更优异,但是利用率会比较低,尤其是较大规模的平台,如果是在较大规模的容器平台,在裸金属的环境下,可以参考GPU Operator的方式调度和管理GPU,同时支持MIG空分和vGPU时分的方式,可以理解同时支持直通和共享的模式,GPU Operator是一个容器平台的插件,包含在NVIDIA AI Enterprise软件套件中。

收起
互联网服务 · 2022-04-28
浏览760

提问者

击歌吟
资深工程师阳光保险
擅长领域: 云计算容器容器云

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2022-04-22
  • 关注会员:3 人
  • 问题浏览:1300
  • 最近回答:2022-05-02
  • X社区推广