如何构建银行离线知识库模型?

目前使用langchain-chatglm2-6b模型加载本地知识库但效果并不理想,是否需要对chatglm2-6b模型微调或者有无更好的模型可以使用。显示全部

目前使用langchain-chatglm2-6b模型加载本地知识库但效果并不理想,是否需要对chatglm2-6b模型微调或者有无更好的模型可以使用。

收起
参与6

返回FishWang的回答

FishWangFishWang课题专家组算法工程师某证券公司

1. 效果不理想需要看下具体的case分析出到底模型哪些知识没有学习到,进行针对性的知识补给和优化。
2. 任何一个真实业务场景,单纯依赖裸模肯定是不行的,一般都需要进行微调。
3. 目前大模型的效果与参数量息息相关,可以试下13B或者130B的大模型,总体上效果一般会更好。

证券 · 2023-09-18
浏览396

回答者

FishWang
算法工程师某证券公司
擅长领域: 人工智能数据库数据安全

FishWang 最近回答过的问题

回答状态

  • 发布时间:2023-09-18
  • 关注会员:2 人
  • 回答浏览:396
  • X社区推广