银行Kubernetes GPU

GPU算力资源的分配颗粒度？

据我所知，目前k8s对GPU资源的共享程度颗粒度是到单个GPU级别，针对中小型计算压力的实际情况来说，单个GPU资源共享的场景实用性及普遍性更高，未来是否存在集群GPU资源共享更小颗粒度的可能性？此外，是否可能根据业务压力功能分配GPU算力的可能？

参与8

查看其它 1 个回答Cui Xiaonan的回答

Cui XiaonanDevRelNVIDIA英伟达

分享一个NVAIE手册里面的一个章节，分别提到了软硬GPU切分的一些颗粒度和技术细节，供大家参考： https://docs.nvidia.com/ai-enterprise/deployment-guide/dg-advance-gpu.html

互联网服务 · 2022-04-28

浏览854

回答者

Cui Xiaonan0725

DevRelNVIDIA英伟达

擅长领域：服务器，GPU，人工智能

评论79

Cui Xiaonan 最近回答过的问题

AI Enterprise需要采购哪种GPU卡，以满足最小化搭建该产品？

GPU资源容器化，在底层的GPU框架上需要做哪些改变？业务开发要注意哪些？

中小金融企业能否利用chatGPT进行弯道超车？

chatgpt在金融机构GPU等相关基础设施运行保障中如何发挥作用？

私有化部署nlp的数据规模与算力的配比？

回答状态

发布时间：2022-04-28

关注会员：3 人

回答浏览：854

关于TWT 使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们
© 2024talkwithtrend — talk with trend,talk with technologist 京ICP备09031017号-30

X社区推广