自学大语言模型的应用程序框架Langchain

字数 1587阅读 505评论 0赞 0

现阶段chatGPT非常火热。带动了第三方开源库：LangChain火热。它是一个在大语言模型基础上实现联网搜索并给出回答、总结 PDF 文档、基于某个 Youtube 视频进行问答等等的功能的应用程序。

什么是Langchain

LangChain 是一个用于开发由语言模型驱动的应用程序的框架。
langchain的目标：最强大和差异化的应用程序不仅会通过 API 调用语言模型，它主要拥有 2 个能力：

Be data-aware：将语言模型连接到其他数据源
Be agentic：允许语言模型与其环境交互
使用语言模型是迈出的重要第一步。通常，在应用程序中使用语言模型时，你并不会直接将用户输入发送给语言模型。相反，你可能会将用户输入组合成一个提示，并将该提示发送给语言模型。

例如，在前面的例子中，我们传递的文本是硬编码的，要求输入一个制造彩色袜子的公司的名称。在这个想象中的服务中，我们希望只使用用户提供的关于公司业务的描述，然后用这些信息来构建提示。
这在LangChain中非常容易实现！

LLM 模型：Large Language Model，大型语言模型

LangChain 中的链由链接组成，链接可以是像 LLM 这样的原始链，也可以是其他链。最核心的链类型是 LLMChain，它由 PromptTemplate 和 LLM 组成。

基础功能

LLM 调用

支持多种模型接口，比如 OpenAI、HuggingFace、AzureOpenAI …
Fake LLM，用于测试
缓存的支持，比如 in-mem（内存）、SQLite、Redis、SQL
用量记录
支持流模式（就是一个字一个字的返回，类似打字效果）
Prompt管理，支持各种自定义模板
拥有大量的文档加载器，比如 Email、Markdown、PDF、Youtube …
对索引的支持
文档分割器
向量化
对接向量存储与搜索，比如 Chroma、Pinecone、Qdrand
Chains
LLMChain
各种工具Chain
LangChainHub
基本概念

Loader 加载器
这个就是从指定数据源中进行加载数据的。比如：文件夹 DirectoryLoader、Azure 存储 AzureBlobStorageContainerLoader、CSV文件 CSVLoader、印象笔记 EverNoteLoader、Google网盘 GoogleDriveLoader、任意的网页 UnstructuredHTMLLoader、PDF PyPDFLoader、 S3DirectoryLoader/S3FileLoader、
Youtube YoutubeLoader 等等，上面只是简单的进行列举了几个，官方提供了超级的多的加载器供你使用。

Document 文档
当使用loader加载器读取到数据源后，数据源需要转换成 Document 对象后，后续才能进行使用。

Text Spltters 文本分割
用来分割文本的，因为每次不管是做把文本当作 prompt 发给 openai api ，还是还是使用 openai api embedding 功能都是有字符限制的。

Vectorstores 向量数据库
因为数据相关性搜索其实是向量运算。所以，不管我们是使用 openai api embedding 功能还是直接通过向量数据库直接查询，都需要将我们的加载进来的数据 Document 进行向量化，才能进行向量运算搜索。转换成向量也很简单，只需要我们把数据存储到对应的向量数据库中即可完成向量的转换。

Chain 链
一个 Chain 就是一个任务，当然也可以像链条一样，一个一个的执行多个链。个人感觉像是计算机的线程。

Agent 代理
可以简单的理解为他可以动态的帮我们选择和调用chain或者已有的工具。

LangChain 大语言模型开发框架大语言模型

著作权归作者所有

如果觉得我的文章对您有用，请点赞。您的支持将鼓励我继续创作！

添加新评论0 条评论

Ctrl+Enter 发表

匿名评论

自学大语言模型的应用程序框架Langchain

什么是Langchain

基础功能

基本概念

添加新评论0 条评论

作者其他文章

相关文章

相关问题

相关资料