大模型趋势下,金融企业如何进行向量数据库的技术选型评估?

向量数据库定位为大模型落地解决数据更新、知识图谱构建、消除幻觉等问题,当前向量数据库市场存在不同的技术路线和诸多厂商的产品,企业面临根据自身应用场景和大模型技术栈,选择适合自身需求的向量数据库的难题。通过本话题的探讨重点考察向量数据类型、向量检索算法、数据...显示全部

向量数据库定位为大模型落地解决数据更新、知识图谱构建、消除幻觉等问题,当前向量数据库市场存在不同的技术路线和诸多厂商的产品,企业面临根据自身应用场景和大模型技术栈,选择适合自身需求的向量数据库的难题。

通过本话题的探讨重点考察向量数据类型、向量检索算法、数据一致性、编程接口、多租户、数据导入导出功能,以及系统架构和技术路线。

收起
参与13

查看其它 5 个回答Ethan_Yang的回答

Ethan_YangEthan_Yang联盟成员技术架构师某金融司

向量数据在2023年才开始兴起来,之前大家对之知之甚少。火起来是因为2023 年 3 月英伟达的黄仁勋在 GTC 大会上点名了向量数据库,且是作为大语言模型的外挂记忆体作为场景定义而出现的,被接纳为 RAG(Retrieval-Augmented Generation)——基于检索增强的内容生成。

RAG 一开始就致力于解决大语言模型(LLM)本身存在的一些问题。做法是:把数据先用工具切分好,通过一个 Embedding 模型转成为向量保存到向量数据库。回答问题时,先把问题也转化为一条向量,再用该向量去数据库内进行 Top K 相似度比对,然后把返回的结果拼接成提示词,交给 LLM 回答。

现在市面上的一种争议是:研发一款向量数据?还是在成熟的数据库中插入内嵌向量搜索能力?(如 pg_vector可让 PostgreSQL 具备向量搜索能力 )。

这边比较倾向于第二种,在现有成熟的数据库中集成向量搜索能力,可以具备检索能力、向量化能力;同时又具备成熟数据库的执行引擎,提供更多的访问能力。让向量搜索成为现有的数据库中的一个功能。

这对于企业来说也许是一个更好的、更容易落地的选择,毕竟做下现有数据库的版本升级即可了。

随着大语言模型(LLM)的发展,企业的数字化转型需要借助LLM构建自身的企业搜索引擎,而现有数据库中引入向量搜索能力,能够帮助企业实现这一目的。

证券 · 2024-02-07
浏览570

回答者

Ethan_Yang
技术架构师某金融司
擅长领域: 数据库灾备人工智能

Ethan_Yang 最近回答过的问题

回答状态

  • 发布时间:2024-02-07
  • 关注会员:7 人
  • 回答浏览:570
  • X社区推广