在创建POD时,YAML中容器请求带上资源类型 nvidia.com/gpu,
可以将POD调度到GPU节点上 。
apiVersion: v1
kind: Pod
metadata: name: gpu-pod
spec:
containers:
- name: cuda-container
image: nvidia/cuda:10.0-base
resources:
limits: nvidia.com/gpu: 1
关于GPU切分及高效共享的解决方案,行业有很多的技术实现,大致分成Remote CUDA,CUDA原生实现,GPU硬件实现。
建议关注NVIDIA AI Enterprise软件套件,包含GPU切分和管理的全部软件功能,并且提供企业级的支持服务。
收起