与传统业务场景相比,大模型对数据存储资源的需求有哪些相同与不同之处?

大模型作为新的应用范式,对数据存储的需求与传统业务有所不同。本议题交流核心是分析大模型应用对数据存储需求的特殊性在哪些方面? 又有哪些与传统业务数据存储需求一致的地方?

参与28

9同行回答

一桶浆糊一桶浆糊存储解决方案架构NA
相同点上面几位老师讲的比较多了,从大模型的生命周期角度补充一下对存储的一些需求:1、数据的采集和处理阶段,比如网络爬取、清洗标注等,这个阶段主要是要求存储支持丰富的接入协议以及海量的存储空间,高吞吐量。2、模型的开发设计阶段,该阶段主要涉及并行开发,需要数据存储具备...显示全部

相同点上面几位老师讲的比较多了,从大模型的生命周期角度补充一下对存储的一些需求:
1、数据的采集和处理阶段,比如网络爬取、清洗标注等,这个阶段主要是要求存储支持丰富的接入协议以及海量的存储空间,高吞吐量。
2、模型的开发设计阶段,该阶段主要涉及并行开发,需要数据存储具备各个兼容各平台能力,比如大数据平台、容器平台等。
3、模型训练阶段,主要是快速读取训练集及checkpoint的保存和读取,需要存储提供非常高效且稳定的数据读写能力。
4、模型推理部署阶段,此阶段我理解主要是计算密集型,但对模型加载和保存有需求,对存储的需求是高性能、高并发。同时具备较高的可靠性。

收起
系统集成 · 2024-01-23
浏览711

ChatGPT 回答

大模型应用相较于传统业务,对数据存储的需求具有以下特殊性:

  1. 数据量大:大模型需要处理的数据量通常非常庞大,这就要求数据存储系统能够承受大规模的数据存储和处理。
  2. 数据类型复杂:大模型需要处理的数据类型通常非常复杂,包括结构化数据、非结构化数据、图像、音频、视频等多种类型,这就要求数据存储系统能够支持多种数据类型的存储和处理。
  3. 数据访问速度要求高:大模型需要快速访问和处理数据,因此数据存储系统需要具有高速读写能力和低延迟的数据访问能力。
  4. 数据安全性要求高:大模型处理的数据通常包含敏感信息,因此数据存储系统需要具有高度的数据安全性,包括数据加密、访问控制、备份和恢复等功能。

与传统业务数据存储需求一致的地方包括:

  1. 数据一致性:无论是大模型还是传统业务,都需要保证数据的一致性,即数据在不同的系统和应用之间能够保持同步和一致。
  2. 数据可靠性:无论是大模型还是传统业务,都需要保证数据的可靠性,即数据在存储和处理过程中不会丢失或损坏。
  3. 数据备份和恢复:无论是大模型还是传统业务,都需要进行数据备份和恢复,以保证数据在意外情况下能够及时恢复。
  4. 数据管理和维护:无论是大模型还是传统业务,都需要进行数据管理和维护,包括数据清洗、数据归档、数据迁移等操作。

提问者

wanggeng
系统运维工程师某银行
擅长领域: 服务器存储数据库

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2024-01-15
  • 关注会员:10 人
  • 问题浏览:2345
  • 最近回答:2024-02-19
  • X社区推广