大语言模型在市面上都推荐哪家模型呢?

大语言模型在市面上都推荐哪家模型呢?

参与11

4同行回答

苟志龙苟志龙课题专家组高级工程师中国民生银行
这里只谈个人使用过,且还愿意继续使用的商用大模型:1、国外:GPT4、Claude2。2、国内:通义千文、文心一言、讯飞星火;智谱GLM系列、百川;AndesGPT、MiniMax、元象、天宫、豆包等。就经验而言,参数量至少30B以上、上下文窗口至少32k以上、RAG应用成熟度高的大模型平均会更好用一些...显示全部

这里只谈个人使用过,且还愿意继续使用的商用大模型:
1、国外:GPT4、Claude2。
2、国内:通义千文、文心一言、讯飞星火;智谱GLM系列、百川;AndesGPT、MiniMax、元象、天宫、豆包等。
就经验而言,参数量至少30B以上、上下文窗口至少32k以上、RAG应用成熟度高的大模型平均会更好用一些;另外就是,同一个任务至少使用三个以上模型提问,并对答案取长补短后使用。

收起
银行 · 2024-02-04
浏览336

ChatGPT 回答

目前市面上推荐的大语言模型主要有以下几个:

  1. GPT-3(Generative Pre-trained Transformer 3):由OpenAI开发,是目前最为知名的大语言模型之一,具有极高的生成能力和智能性,能够完成各种自然语言处理任务。
  2. T5(Text-to-Text Transfer Transformer):由Google开发,是一种基于Transformer的大型预训练模型,可以用于各种自然语言处理任务,如文本摘要、翻译、问答等。
  3. GShard:由Google开发,是一种分布式训练框架,可以训练超大规模的语言模型,具有较高的训练效率和性能。
  4. Megatron-LM:由NVIDIA开发,是一种基于Transformer的大型预训练模型,可以用于各种自然语言处理任务,如文本生成、语言理解等。

以上模型都具有较高的性能和智能性,可以根据具体的应用场景和需求进行选择。

提问者

BOOKER
环境管理兴业数金

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2023-06-09
  • 关注会员:5 人
  • 问题浏览:1438
  • 最近回答:2024-02-04
  • X社区推广