GPU、CPU优化利用?

如何通过GPU 计算节点与 CPU 指令集的配置,高效完成机器学习、深度学习、图像识别等 AI 计算任务,高性能地承载企业大规模并行计算需求,能否通过滚动升级方式,在主机不停机、应用不停服的状态下完成升级,有效保障企业业务的连续性

参与11

3同行回答

罗文江罗文江课题专家组云计算架构师某银行
通常部署一套基于K8S的容器平台产品,将CPU 内存 GPU 磁盘等计算资源统一池化,同时通过CSI机制规划实施一套共用的数据持久化的容器存储,用于AI任务的数据存储。 主机不停机是由K8S将故障节点的任务负载 迅速调度漂移到其他可用节点来实现的。应用不停服是由任务负载的调度...显示全部
  1. 通常部署一套基于K8S的容器平台产品,将CPU 内存 GPU 磁盘等计算资源统一池化,同时通过CSI机制规划实施一套共用的数据持久化的容器存储,用于AI任务的数据存储。 主机不停机是由K8S将故障节点的任务负载 迅速调度漂移到其他可用节点来实现的。应用不停服是由任务负载的调度漂移 + 容器存储中数据+任务中断的可恢复性设计共同组合来实现的。
收起
银行 · 2022-05-01
浏览952

提问者

wwu
信息系统项目管理省城商
擅长领域: 云计算服务器容器

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2022-04-26
  • 关注会员:4 人
  • 问题浏览:2006
  • 最近回答:2022-05-01
  • X社区推广