互联网服务数据集大模型

大模型和数据集的关系是什么?

参与3

1同行回答

Eric雪飞Eric雪飞存储专委 副主任上海市计算机学会
如果按照大模型的学术定义去理解,LLM大语言模型,那么它只是指最新的一种AI技术路线,从卷积神经网络CNN开始,在AI领域,技术路线已经发展了7代,如下: CNN –> RNN->LSTM->RNN/LSTM +Attention -> Transformer -LLM如果是这个定义,那么 基础大模型+数据集+GPU集群,再加...显示全部

如果按照大模型的学术定义去理解,LLM大语言模型,那么它只是指最新的一种AI技术路线,
从卷积神经网络CNN开始,在AI领域,技术路线已经发展了7代,如下:
CNN –> RNN->LSTM->RNN/LSTM +Attention -> Transformer -LLM

如果是这个定义,那么 基础大模型+数据集+GPU集群,再加上工程师去做训练微调,就能打造出一个有特色的生成式AI。数据集的好坏和工程师的调教水平,决定了最后的成果。

如果是用大模型作为生成式AI的昵称,那么基本上生成式AI的培育也和数据集的大小质量高度相关。什么数据训出什么AI,数据集的完整度和本身的质量是很重要的。

  大模型的“大”目前可以理解为参数量,最前沿的GPT4使用1.8万亿参数,到目前为止,参数量的边际效用已经递减,130B这种千亿级参数在某些应用中表现也不弱。

两者的关系可以比做学生和课本:不同的大模型像学生,天分有高低;不同的数据集像教材或课本或图书馆,数据的量和质就是书本知识的全面和正经。最终训练成就和两者都有紧密关联

收起
IT其它 · 2023-09-22
浏览365

ChatGPT 回答

在互联网服务行业中,大模型和数据集是密不可分的。数据集是指用于训练和测试机器学习模型的大量数据集合,而大模型则是指由大量参数构成的复杂机器学习模型。

数据集是训练大模型的基础,大模型需要通过数据集进行训练,从而不断优化和提升自身的准确性和效率。在训练过程中,数据集的质量和规模对于大模型的性能和效果至关重要。通常情况下,数据集越大,大模型的训练时间和准确性都会更高。

同时,大模型也可以用于优化数据集。通过大模型的预测结果,可以发现数据集中的错误和缺陷,从而进一步完善和优化数据集。

因此,数据集和大模型是相互依存的,它们之间的关系是相辅相成的。在互联网服务行业中,数据集和大模型的优化和应用,可以帮助企业提升产品的质量和用户体验,提高企业的竞争力。

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2023-09-22
  • 关注会员:2 人
  • 问题浏览:894
  • 最近回答:2023-09-22
  • X社区推广