银行网络人工智能 GPU 大语言模型银行AI大模型

如何减少网络对AI训练的影响？

如题
迈入ChatGPT大语言模型时代，金融行业提高GPU资源利用效能加速AI智能化应用，那们如何减少网络对AI训练的影响？

收起

关注6

参与22

查看其它 3 个回答朱向东的回答

朱向东

高级工程师某银行

这是个好问题，提到减少网络对AI训练的影响，想必你所在AI环境的规模已经不小了，单机或较小规模场景下，一般都不会考虑到网络对AI环境的影响，其实，AI环境对网络的依赖程度是非常高的，成规模化部署时必须要提前规划好AI环境的网络架构，如存储网络区、训练网络区、推理网络区、业务网络区等。
那么，如何减少网络对AI训练的影响，大概可以从以下几个方面着手：
1、在训练模型前，对数据进行预处理，减少数据在网络上的传输量。
2、将模型分散到多台服务器上，减少每台服务器之间相互交互的网络负载。
3、适当考虑增大服务器本地磁盘，将数据缓存到服务器本地硬盘上，避免每次训练都从网络上传输数据。
4、审视当前网络结构，减少网络层数，减少不必要的网络设备，减少网络之间的传输负载。
5、选用合适的模型，减少模型的大小和参数量，尽量降低网络传输的负载。
6、考虑使用专用AI硬件设备来提高训练效率，同时降低网络传输负载。
7、重新审视所选的训练工具，评估其网络传输负载对网络环境的影响。
综合来说，要结合实际需求情况和自身的网络现状及AI训练环境的现状去考虑整体的解决方案。

银行 · 2023-04-20

查看赞同的人

如何减少网络对AI训练的影响？

查看其它 3 个回答朱向东的回答

回答者

朱向东最近回答过的问题

回答状态

如何减少网络对AI训练的影响？

查看其它 3 个回答朱向东的回答

回答者

朱向东 最近回答过的问题

回答状态

朱向东最近回答过的问题