非训练场景下,测试环境如果只有少量的GPU卡,该如何进行GPU资源的复用(包括算力与显存)?
这就是典型的GPU共享场景,可以利用GPU虚拟化技术将测试环境资源进行池化,技术方案有很多:1、硬件厂商方案,可以根据GPU厂商选择厂商提供方案,如Nvidia vGPU,AMD MxGPU,intel GVT-g,后两家都已经开源2、采用头部云厂商方案,如阿里云 cGPU、 腾讯云 qGPU、 Vmware Bitfusion等3、第三方厂商,如OrionX以上方案都支持算力和显存切分,不过都依赖厂商方案,如果用K8S的开源插件,只能实现按卡粒度的分配,看是否满足要求
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30