据我所知,目前k8s对GPU资源的共享程度颗粒度是到单个GPU级别,针对中小型计算压力的实际情况来说,单个GPU资源共享的场景实用性及普遍性更高,未来是否存在集群GPU资源共享更小颗粒度的可能性?此外,是否可能根据业务压力功能分配GPU算力的可能?
收起分享一个NVAIE手册里面的一个章节,分别提到了软硬GPU切分的一些颗粒度和技术细节,供大家参考: https://docs.nvidia.com/ai-enterprise/deployment-guide/dg-advance-gpu.html