大家好,我是IBM技术工程师何兵。
PowerAI Enterprise Solution是一个用来管理机器学习、深度学习的解决方案,该解决方案包括了硬件、开源框架、集群环境中的资源调度、任务调度、机器学习及深度学习的数据及模型生命周期管理及提供给客户的技术服务
硬件包括IBM的带Nvidia GPU芯片的服务器,目前有4-5款,高配置的机型是S822LC For HPC,也叫Minsky,可以带2个或4个Nvidia P100 GPU。硬件设计的独到之处是CPU和GPU之间的通讯采用Nvidia NVLink协议,当前是1.0版本,速度是80GB/s,而广泛使用的PCIe 3.0的带宽只有32GB/s,因此在深度学习的很多场景中,性能会更好。
软件包括Linux OS发行版,包括Ubuntu, Redhat和Suse
开源框架包括主流的框架,如TensorFlow, Caffe, Torch等7种,IBM提供下载包直接安装,而不需要客户自己编译
集群环境中的资源调度、任务调度包括IBM的Conduct with Spark产品
数据及模型的生命周期管理软件包括BlueMind软件,里面已经包括了几十个经过测试验证过的网络模型,供客户下载使用
PowerAI属于能管理多种开源框架,是AI团队优先选择的模型管理、训练、服务发布的平台
PowerAI Enterprise的独特优势有如下几点: