软件开发大语言模型大模型

场景数据集不多是否不建议大模型微调且大约多少的数据量可以支撑大模型微调呢？

关注3

参与6

2同行回答
全部行业
全部行业 软件开发 系统集成
|
按赞同排序
按时间排序

匿名用户

十亿的参数大模型，最好有5位数以上的微调数据。

收起

软件开发 · 2023-10-30

查看赞同的人

mxin资深工程师上海宝信软件股份有限公司

对于场景数据集不多的情况，不建议使用大模型进行微调。这是因为大模型通常需要更多的数据来进行训练和调整参数，以获得更好的性能。如果只有少量的场景数据可用，微调大模型可能会导致过拟合问题，即模型在训练数据上表现良好，但在新的场景数据上表现较差。
相反，对于少量数据的情况，建议使用小一些的模型进行微调。小模型具有较少的参数，因此对数据的需求量相对较小。此外，还可以采用一些技巧来增强模型的泛化能力，例如数据增强、迁移学习等。
关于多少数据量可以支撑大模型微调，这没有一个固定的答案，因为它取决于具体的应用场景和数据质量。一般来说，至少需要几千到几万个样本才能支撑大模型的训练和微调。然而，为了获得更好的性能，通常需要更多的数据。因此，尽可能收集更多的场景数据是提高模型性能的重要步骤之一。

收起

系统集成 · 2023-10-31

ChatGPT 回答

在软件开发行业中，大模型和大语言模型已经成为了热门话题。对于场景数据集不多的情况，建议先使用预训练的大模型或大语言模型进行微调，以提高模型的性能。

对于大模型微调所需的数据量，这取决于模型的大小和复杂度，以及微调的任务类型。一般来说，如果模型非常大且复杂，那么需要更多的数据才能进行微调。但是，如果微调的任务比较简单，那么需要的数据量就会相对较少。

一般来说，建议使用至少几千个样本进行微调，这样可以确保模型具有足够的泛化能力。但是，如果数据集非常小，那么可以考虑使用数据增强技术来扩充数据集，以提高微调的效果。

总之，对于场景数据集不多的情况，建议使用预训练的大模型或大语言模型进行微调，并根据具体情况选择合适的数据量进行微调。

场景数据集不多是否不建议大模型微调且大约多少的数据量可以支撑大模型微调呢？

2同行回答
全部行业
全部行业 软件开发 系统集成
|
按赞同排序
按时间排序

ChatGPT 回答

提问者

问题来自

相关问题

相关资料

相关文章

问题状态

场景数据集不多 是否不建议大模型微调 且大约多少的数据量可以支撑大模型微调呢？

2同行回答全部行业全部行业软件开发系统集成|按赞同排序按时间排序

ChatGPT 回答

提问者

问题来自

相关问题

相关资料

相关文章

问题状态

场景数据集不多是否不建议大模型微调且大约多少的数据量可以支撑大模型微调呢？

2同行回答
全部行业
全部行业软件开发系统集成
|
按赞同排序
按时间排序