作者:Gem Dilmegani
翻译:MLOps社区
自 2019 年以来,由于大型语言模型 (LLM) 的广泛应用领域和功能,这些模型的数量一直在增加(见图 1)。
图1:自2019年以来LLM数量的增加 1
然而,估计显示,设计一个新的基础模型可能花费高达90万美元,而微调或增强现有的大型语言模型可能花费1万到100万美元。 2 这些费用来自:
LLMOps工具可以通过促进LLM管理来降低这些成本。但是,LLMOps是一个相对较新的解决方案,大多数商业领袖都不知道这个市场的领先者。本文解释了LLMOps市场并比较了可用的工具。
有20 +工具声称是LLMOps解决方案,可以在三个主要类别下进行评估:
这些要么是专门为LLMOps设计的,要么是开始提供LLMOps功能的MLOps平台。它们包括允许在LLM上执行这些操作的功能:
这些LLM平台可以提供不同级别的灵活性和易用性:
这些工具旨在促进开发LLM应用程序,例如文档分析器,代码分析器,聊天机器人等。
VD 存储高维数据向量,例如涵盖症状、血液检查结果、行为和一般健康状况的患者数据。一些VD软件,如深湖可以促进LLM操作。
这些工具简化了LLM工作流程的特定部分,例如测试提示,合并人工反馈(RLHF)或评估数据集。
在本节中,我们将重点介绍 LLMOps 平台以及排除的集成框架和其他工具。LLMOps平台可以在以下类别中进行检查:
某些 MLOps 平台可以部署用于 LLMOps。机器学习操作 (MLOps) 管理和优化端到端机器学习生命周期。由于LLM也是机器学习模型,MLOps供应商自然会扩展到这一领域。
一些LLM提供商,特别是OpenAI,也提供LLMOps功能来微调,集成和部署他们的模型。
数据或云平台开始提供LLMOps功能,允许其用户利用自己的数据来构建和微调LLM。例如,Databricks以1亿美元的价格收购了MosaicML。 3
云领导者亚马逊,Azure和谷歌都推出了LLMOps产品,允许用户轻松部署来自不同提供商的模型。
此类别包括专门专注于优化和管理LLM操作的工具。下表显示了其中一些LLMOps工具的Github星级,B2B评论和B2B评论页面(Trustradius,Gartner和G2)的平均B2B得分:
图2:彗星LLMops平台 4
图3:浮潜人工智能平台 5
我们知道有不同的方法可以对这些工具进行分类。例如,一些供应商包括可以帮助在此环境中开发大型语言模型的其他技术,例如容器化或边缘计算。但是,这些技术不是为设计或监视模型而构建的,即使它们可以与 LLMOps 工具配对以提高模型性能。因此,我们排除了这些工具。
更经典的方法根据许可证类型(例如是否开源)或工具是否提供预先训练的模型对工具进行分类。虽然这些是相关的分类,但我们认为它们不如该工具提供的其他功能重要。例如,LLM是否开源非常重要,因为它会影响最终用户如何微调模型。但是,与大多数其他软件一样,LLMOps平台将被大多数最终用户使用,而无需修改软件代码,因此LLMOps工具开源的影响较小。
我们现在提供有关选择这些工具的相对通用的建议。随着我们更详细地探索LLMOps平台以及随着市场的成熟,我们将使这些更加具体。
以下是您在选择过程中必须完成的几个步骤:
大型语言模型 (LLM) 是高级机器学习模型,旨在根据他们从训练数据中学到的模式和信息来理解和生成类似人类的文本。这些模型是使用深度学习模型构建的,以捕获复杂的语言细微差别和上下文。
LLMOps是指用于生产环境中LLM操作模型管理的技术和工具。
如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!
赞0
添加新评论0 条评论