硬件层如何更好地助力用户适配人工智能场景？

参与3

返回吴跃的回答

吴跃AI解决方案架构师戴尔科技集团

从面向AI应用场景的基础设施硬件适配，我们有几点建议供您参考：
1）明确您当前的AI业务场景，区分传统AI模型与生成式AI/AI大模型，AI的不用业务阶段：训练/微调还是推理，针对不同的业务场景确立最适合的加速芯片硬件选型；大模型对于算力和显存的要求，要高于传统AI算法模型；
2）从系统的角度，我们建议从AI全生命周期Pipeline进行AI基础设施的架构设计与性能规划，包含异构加速计算-网络通讯-存储I/O，避免出现系统组件性能不匹配而出现“木桶短板”；
3) 针对当前更大的AI模型算力需求，我们可以提供基于多机多卡的AI分布式训练技术，避免对单机或者单个算力卡过高的性能压力；
4）不论是针对模型开发训练，还是AI线上推理部署，通过一些AI软件技术和解决方案，比如GPU池化、虚拟化技术，更加灵活的资源管理与调度机制，可以能够更加有效地提升AI硬件资源的有效利用率。

硬件生产 · 2023-11-29

硬件层如何更好地助力用户适配人工智能场景？

返回吴跃的回答

回答者

回答状态