互联网服务GPU

如何高效的GPU资源复用?

非训练场景下,测试环境如果只有少量的GPU卡,该如何进行GPU资源的复用(包括算力与显存)?显示全部

非训练场景下,测试环境如果只有少量的GPU卡,该如何进行GPU资源的复用(包括算力与显存)?

收起
参与14

查看其它 2 个回答daliu的回答

daliudaliu系统架构师某金融机构

这就是典型的GPU共享场景,可以利用GPU虚拟化技术将测试环境资源进行池化,技术方案有很多:
1、硬件厂商方案,可以根据GPU厂商选择厂商提供方案,如Nvidia vGPU,AMD MxGPU,intel GVT-g,后两家都已经开源
2、采用头部云厂商方案,如阿里云 cGPU、 腾讯云 qGPU、 Vmware Bitfusion等
3、第三方厂商,如OrionX
以上方案都支持算力和显存切分,不过都依赖厂商方案,如果用K8S的开源插件,只能实现按卡粒度的分配,看是否满足要求

银行 · 2023-04-24
浏览603

回答者

daliu
系统架构师某金融机构
擅长领域: 人工智能服务器GPU

daliu 最近回答过的问题

回答状态

  • 发布时间:2023-04-24
  • 关注会员:4 人
  • 回答浏览:603
  • X社区推广