银行大语言模型大模型 ChatGLM

运维领域大模型微调问题？

我想使用开源大模型微调一个比如运维领域知识库（chatglm2-6b,Baichuan-13b），目前数据量大概1000多条。如果我问训练集数据，回答准确率符合要求，但是如果稍增加几个单词或者换一种问法，就完全不对了，请问这是什么原因。

关注3

参与6

2同行回答
全部行业
全部行业 银行 零售/批发
|
按赞同排序
按时间排序

朱向东

高级工程师某银行

准确率不符合要求的话，个人理解应该是训练的数据量太小或数据有偏差或数据依赖等原因。大模型通常需要大量的数据来学习丰富的语言模式和上下文。如果数据量不足，模型可能无法捕捉到不同问题之间的细微差别和变化。
如果训练集中的数据在问题类型、问法和领域上存在较大的偏差，模型可能会过度拟合这些特定的模式。当遇到新的问题或问法时，模型可能会表现不佳，因为它没有足够的泛化能力。
如果微调的数据中缺乏足够的上下文信息，模型可能无法准确理解问题的含义或提供恰当的答案。
所以，你所说的运维领域的知识库可能具有特定的术语、上下文和约定，需要更多的领域相关数据来训练模型。如果微调数据中的领域特定性较低，模型可能无法很好地理解和回答与该领域相关的问题。

收起

银行 · 2023-10-30

查看赞同的人

waring_id技术经理某公司

应该还是数据量不足导致的吧

收起

零售/批发 · 2023-11-10

ChatGPT 回答

这种情况可能是由于数据量不足或者数据质量不够高导致的。在使用大模型进行微调时，训练数据的质量和数量对模型的性能影响非常大。如果训练数据量太小，模型就无法学习到足够多的语言规律和语义知识，导致模型泛化能力不足，无法应对新的问题。如果训练数据质量不够高，比如存在噪声、歧义、不一致性等问题，模型也会受到影响，导致准确率下降。

针对这种情况，建议您可以考虑以下几个方面来优化模型：

增加训练数据量：尽可能收集更多的数据，尤其是一些较为复杂的场景和问题，以提高模型的泛化能力。
提高训练数据质量：对训练数据进行筛选、清洗、去重等处理，尽可能减少噪声和不一致性，提高数据质量。
优化模型架构和超参数：针对具体的任务和数据集，调整模型架构和超参数，以提高模型的性能和泛化能力。
引入预训练模型：使用预训练模型进行微调，可以大幅提高模型的性能和泛化能力，尤其是在数据量较小的情况下。
增加人工干预：在模型预测结果不确定或者不准确的情况下，引入人工干预，对模型进行修正和优化，以提高模型的准确率和稳定性。

运维领域大模型微调问题？

2同行回答
全部行业
全部行业 银行 零售/批发
|
按赞同排序
按时间排序

ChatGPT 回答

提问者

问题来自

相关问题

相关资料

相关文章

问题状态

运维领域大模型微调问题？

2同行回答全部行业全部行业银行零售/批发|按赞同排序按时间排序

ChatGPT 回答

提问者

问题来自

相关问题

相关资料

相关文章

问题状态

2同行回答
全部行业
全部行业银行零售/批发
|
按赞同排序
按时间排序