大语言模型在市面上都推荐哪家模型呢？

参与11

4同行回答
银行
全部行业 互联网服务 基金 银行
|
按赞同排序
按时间排序

高级工程师中国民生银行

这里只谈个人使用过，且还愿意继续使用的商用大模型：
1、国外：GPT4、Claude2。
2、国内：通义千文、文心一言、讯飞星火；智谱GLM系列、百川；AndesGPT、MiniMax、元象、天宫、豆包等。
就经验而言，参数量至少30B以上、上下文窗口至少32k以上、RAG应用成熟度高的大模型平均会更好用一些；另外就是，同一个任务至少使用三个以上模型提问，并对答案取长补短后使用。

收起

银行 · 2024-02-04

ChatGPT 回答

目前市面上推荐的大语言模型主要有以下几个：

GPT-3（Generative Pre-trained Transformer 3）：由OpenAI开发，是目前最为知名的大语言模型之一，具有极高的生成能力和智能性，能够完成各种自然语言处理任务。
T5（Text-to-Text Transfer Transformer）：由Google开发，是一种基于Transformer的大型预训练模型，可以用于各种自然语言处理任务，如文本摘要、翻译、问答等。
GShard：由Google开发，是一种分布式训练框架，可以训练超大规模的语言模型，具有较高的训练效率和性能。
Megatron-LM：由NVIDIA开发，是一种基于Transformer的大型预训练模型，可以用于各种自然语言处理任务，如文本生成、语言理解等。

以上模型都具有较高的性能和智能性，可以根据具体的应用场景和需求进行选择。

大语言模型在市面上都推荐哪家模型呢？

4同行回答
银行
全部行业 互联网服务 基金 银行
|
按赞同排序
按时间排序

ChatGPT 回答

提问者

问题来自

相关问题

相关资料

相关文章

问题状态

大语言模型在市面上都推荐哪家模型呢？

4同行回答银行全部行业互联网服务基金银行|按赞同排序按时间排序

ChatGPT 回答

提问者

问题来自

相关问题

相关资料

相关文章

问题状态

4同行回答
银行
全部行业互联网服务基金银行
|
按赞同排序
按时间排序