大模型微调过程中如何避免灾难性遗忘?

微调后大模型容易出现灾难性遗忘,导致其他能力下降。使用什么数据和技术组合,能提升特定任务的同时,不造成其他能力丧失,对企业处理多业务功能需求有很大意义。显示全部

微调后大模型容易出现灾难性遗忘,导致其他能力下降。使用什么数据和技术组合,能提升特定任务的同时,不造成其他能力丧失,对企业处理多业务功能需求有很大意义。

收起
参与30

查看其它 8 个回答soap的回答

soapsoap课题专家组人工智能算法工程师申万宏源证券有限公司

大模型微调的过程,如果能够蒸馏出一个较小的模型,灾难性遗忘的影响能够缓解。同时在特定场景数据集上表现也会更好。此外,回顾之前的样本也能够有效避免灾难性遗忘。

证券 · 2024-01-22
浏览805

回答者

soap
人工智能算法工程师申万宏源证券有限公司
擅长领域: 人工智能大数据数据库

soap 最近回答过的问题

回答状态

  • 发布时间:2024-01-22
  • 关注会员:10 人
  • 回答浏览:805
  • X社区推广