证券异构云

多个GPU不同版本,不同厂商怎么池子化,整个一个快?

多个GPU不同版本,不同厂商怎么池子化,整个一个快

参与5

2同行回答

waring_idwaring_id技术经理某公司
参照云计算资源池的方式来规划1、将同规格的GPU资源规划为同一个资源群集2、将不同规划的资源群集纳入到一个大的资源池3、具体的资源调度优先考虑按群集规划显示全部

参照云计算资源池的方式来规划
1、将同规格的GPU资源规划为同一个资源群集
2、将不同规划的资源群集纳入到一个大的资源池
3、具体的资源调度优先考虑按群集规划

收起
零售/批发 · 2024-04-01
浏览69
Eric雪飞Eric雪飞存储专委 副主任上海市计算机学会
这个貌似不能的吧?难度太大首先,不同厂商GPU对cuda支持程度肯定还是有差距,起码有完全支持,号称兼容,完全不支持三级;另外就算是N记自己的卡,不同型号的GPU卡显存大小,带宽都是有区别的,你放到一个池子里,软件怎么区分呢?还是写一个分层分级管理的软件平台?不同任务发给不同定义的”...显示全部

这个貌似不能的吧?难度太大

首先,不同厂商GPU对cuda支持程度肯定还是有差距,起码有完全支持,号称兼容,完全不支持三级;另外就算是N记自己的卡,不同型号的GPU卡显存大小,带宽都是有区别的,你放到一个池子里,软件怎么区分呢?还是写一个分层分级管理的软件平台?不同任务发给不同定义的”逻辑GPU“,这可是个大工程啊。

这平台先不说能不能实现,就算实现能跑通,平台效率也是个问题,毕竟额外加了一层,本身就是个拖累,写得不好,估计总体看来反而适得其反,慢了很多

收起
IT其它 · 2024-02-07
浏览184

ChatGPT 回答

针对证券行业中多个GPU不同版本、不同厂商的池子化问题,可以考虑以下方案:

  1. 选择合适的GPU池管理软件:可以选择一些成熟的GPU池管理软件,如Kubernetes、Docker Swarm等,这些软件可以帮助管理多个GPU节点,实现GPU资源的池子化。
  2. 统一GPU驱动版本:为了保证GPU池的稳定性和性能,可以统一GPU驱动版本,避免不同版本之间的兼容性问题。可以选择一些稳定的GPU驱动版本,如NVIDIA的官方驱动版本。
  3. 使用容器化技术:可以使用Docker等容器化技术,将应用程序和GPU驱动打包成容器,便于在不同的GPU节点上部署和运行。同时,容器化技术还可以提高GPU资源的利用率,减少资源浪费。
  4. 利用异构云平台:可以选择一些支持异构计算的云平台,如阿里云、华为云等,这些云平台可以提供多种不同型号、不同厂商的GPU资源,可以根据实际需求选择合适的GPU资源进行池子化管理。
  5. 实现GPU资源共享:可以通过一些GPU资源共享技术,如NVIDIA的GPU共享技术,将多个GPU节点的资源进行共享,提高GPU资源的利用率,减少资源浪费。

综上所述,针对证券行业中多个GPU不同版本、不同厂商的池子化问题,可以选择合适的GPU池管理软件、统一GPU驱动版本、使用容器化技术、利用异构云平台以及实现GPU资源共享等方案,来实现GPU资源的池子化管理,提高GPU资源的利用率和性能。

提问者

wangt981
数据分析国盛证券

问题来自

相关问题

问题状态

  • 发布时间:2024-01-29
  • 关注会员:3 人
  • 问题浏览:566
  • 最近回答:2024-04-01
  • X社区推广