证券云平台容器云显卡切分

容器云怎么做显卡切分？

背景
容器云中的显卡切分使用

场景
使用显卡切分功能后，一块显卡如何加载到不同容器中使用

参与9

2同行回答
全部行业
全部行业 互联网服务 银行
|
按赞同排序
按时间排序

课题专家组

云计算架构师某银行

一. 通过GPU虚拟化技术对GPU显卡进行切分，粒度可以细化到0.1卡。譬如 NVIDIA MPS或虚拟 GPU (vGPU) 技术，腾讯的vGPU开源项目、国内创业公司趋动科技的GPU虚拟化技术。

二. 建设基于K8S的一个GPU管理平台，通过平台的调度能力和配置策略来实现将一块GPU显卡分别加载到不同容器中使用。主要步骤如下：

环境准备：
（A） GPU节点安装好NVIDIA驱动和 nvidia-docker套件。
（B）docker daemon运行时配置启动 nvidia runtime运行时。
（C）在 Kubernetes 安装nvidia的k8s-device-plugin开启vGPU支持，
在创建POD时，YAML中容器请求带上资源类型 nvidia.com/gpu，
   可以将POD调度到GPU节点上。
  apiVersion: v1
kind: Pod
metadata: name: gpu-pod
spec:
    containers:
```
  - name: cuda-container 
    image: nvidia/cuda:10.0-base 
    resources:
       limits: nvidia.com/gpu: 1
```

银行 · 2022-05-02

浏览1641

查看赞同的人

Cui XiaonanDevRelNVIDIA英伟达

关于GPU切分及高效共享的解决方案，行业有很多的技术实现，大致分成Remote CUDA，CUDA原生实现，GPU硬件实现。

R-CUDA的方案，也叫远程CUDA和CUDA劫持，是一种基于驱动或CUDA句柄的拦截和转发机制，英伟达官方并不支持这样的做法，尤其在跨服务器请求转发方面，其性能和效果对于网络和处理延时依赖较大，对于实时性的业务场景效果并不理想，同时随着GPU驱动的升级，对于其支持的周期风险很大。
CUDA原生实现，主要指英伟达的vGPU全切分方案，通过定制的GPU驱动，实现GPU的时分切分，基于时间片轮训机制，实现GPU显存最小粒度的切分，该方案是英伟达的原生技术实现，需要相应的License和技术支持服务。
GPU硬件切分技术，只要在A100和A30的GPU上提供，未来的H100也会支持，实现机制是通过GPU内部相应计算单元和显存单元的动态划分，实现硬件的空间切片，彼此的隔离性达到最佳，对于上层系统相对透明，且提供灵活的配置，该技术仅在A100和A30 GPU支持，不需要软件License。

建议关注NVIDIA AI Enterprise软件套件，包含GPU切分和管理的全部软件功能，并且提供企业级的支持服务。

互联网服务 · 2022-04-28

浏览1776

追风者
请问，这些切分，对容器运行环境有限制吗？比如说虚拟机上运行容器也可行吗？
2023-02-01
赞同1
评论

添加评论

提问者

项目经理证通股份

擅长领域：云计算，容器，容器云

评论96

问题来自

活动 - 如何在容器云环境建设和优化GPU资源池加速AI工作负载？ —NVIDIA AI Enterprise产品社区发布活动

相关问题

在现有监控系统下，如何进行容器云应用监控实施？

金融行业中，有哪些系统已经应用了容器化数据库？

银行业信创云平台是否可配套提供容器服务能力，是否同时兼容海光、鲲鹏、Intel三种芯片，是否提供维护？

金融行业容器数据库对比传统数据库的主要变化在哪里？或者是架构上哪一层发生了变化？

目前容器云存储除了NAS和对象存储常见场景外，SAN存储在银行使用情况？

相关资料

2021 容器云职业技能大赛团队赛亚军作品——金融行业容器平台建设方案

2021 容器云职业技能大赛团队赛冠军作品——适用于大中型银行的云原生技术体系建设方案

2021 容器云职业技能大赛团队赛优秀作品——银行全场景容器云平台建设方案

魅族容器云平台基于 k8s 的自动化运维实践

拨云见日，求真务实从需求变化与业内实践，看云平台存储选型

相关文章

省农信关键业务系统基于Power云架构的应用实践

银行业信创架构设计规划及实践

容器云安全现状分析和发展趋势

容器云多集群环境下如何实践 DevOps

某银行基于容器云的应用服务架构实践

问题状态

发布时间：2022-04-25

关注会员：3 人

问题浏览：3071

最近回答：2022-05-02

关于TWT 使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们
© 2024talkwithtrend — talk with trend,talk with technologist 京ICP备09031017号-30

X社区推广