penghuasheng
作者penghuasheng·2024-03-25 15:06
数字化运维研发团队负责人·广发证券

通用大模型、行业内的运维领域大模型、企业内运维大模型关系是什么?(同业交流共识话题)

字数 2572阅读 1343评论 3赞 5

一、议题说明

随着人工智能技术的不断突破,大模型在众多领域开始显现其巨大潜力。在运维领域,我们看到一些领先的企业正在运用大模型赋能稳定性保障工作,比如利用大模型赋能IT服务台与知识库管理的服务质量、辅助编写脚本、与ChatOps结合打造高效的协同效率、辅助进行故障定位等方面取得了不错的效果。同时,我们调研中了解到像GPT这类通用大模型与运维领域要求高度准确性、安全性方面有一些差距,所以一些企业提出了建立领域大模型和企业内私有大模型的解决方案。本议题聚焦讨论通用大模型、行业内的运维领域大模型、企业内运维大模型的关系及其实践应用。

二、议题同业交流

议题主持人:彭华盛 广发证券 信息技术部数字化运维研发团队负责人
议题同行交流:杨磊 某大型券商数据库架构师、陈雪菲 上海市计算机学会、大伟 某股份制银行大模型平台负责人、毛亦凯 某股份制银行 大模型工程师。

1)杨磊 某大型券商数据库架构师
大模型可以被视为一种泛化学习、理解能力模型。类比人的知识模型,就是在自身学习能力的模型基础上,先分析“人”要学习、掌握哪些“知识”,将来从事哪个方向的“职业”。其中“知识”可以理解为训练数据、“学习和掌握”过程,即进行数据训练和模型评估;而“职业”就是本议题关注的大模型类别(通用性、行业行、企业性),以及在往下的划分如日志分析及预警、数据库sql解释和自助式生成、提炼知识点形成知识图谱、风控领域等场景应用。在运维领域,Ethan_Yang建议通用大模型、行业运维大模型和企业运维大模型的研究工作可考虑从以下几个方面开展:

  • 定位能力边界:明确大模型的应用场景和能力范围,考虑投资回报比。
  • 建立算法库:了解当前主流大模型的特点及进展,如GPT-3,4、T5、Megatron-LM、XLNet,开源大模型有CodeLlama-7B、ChatGLm3-6b、Baichuan2-13B等。
  • 数据标准与边界:确定数据收集标准,确保数据采集合规性,并在数据量不足时考虑合成训练集。
  • 评价标准与指标:制定大模型的评价标准和评估指标,以确保其服务能力的准确度和精度。
  • 纠错反馈机制:建立大模型的纠错和告警机制,类似于监控系统的建设。
  • 成本控制:考虑采用行业大模型+公司小模型的形式,以控制成本。
  • 风险提示:由于大模型具有不确定性,应提供必要的模型应用风险提示。

对于日志分析作为大模型的切入点,Ethan_Yang认为大模型可以帮助运维人员提炼更为详尽的分析项,减少其专业要求和精力投入。难点在于确定数据收集的边界、选择合适的算法,并进行训练和微调。

2)陈雪菲 上海市计算机学会
通用大模型是由头部大平台型企业和组织打造的,能够对“互联网”级的知识相关问题给出相对准确的答案。在运维领域,通用大模型、行业运维大模型和企业运维大模型的区别主要在于训练数据集的差别和形成能力的大小。

对于日志分析处理作为运维工作的一部分,认为上述三个概念只是覆盖范围的差距,都是运维大模型的范畴。通用大模型需要处理各种通用平台和常见标准化系统,但具体范围有待商榷。行业运维大模型则相对清晰,主要针对金融行业的各种软硬件平台。企业运维大模型则更加确定,针对特定企业使用的系统。

通过作为大模型的定义,可以分别收集相应范畴的数据进行训练和微调工作。在大模型场景应用或重点聚焦的能力上,可以考虑以日志分析能力为基础,朝故障告警和预测能力的方向发展与投入。

3)大伟 某股份制银行大模型平台负责人
定义: 通用大模型通常指一种集成了多种功能的AI系统,可以处理多种任务,并可通过学习提高表现。这种模型通常包含大量参数和神经元,并通过对大量数据的学习来提高性能。
行业内的运维领域大模型可能指专门针对运维领域设计的大模型,旨在处理运维相关任务,如系统监控、故障诊断等。
企业内运维大模型则指在某个企业内部应用的运维大模型,主要服务于该企业的运维需求。
应用领域: 通用大模型的应用领域广泛,包括但不限于语音识别、自然语言处理、图像识别等领域。
行业内的运维领域大模型主要应用于该行业的运维领域,解决该行业的特定问题。
企业内运维大模型主要应用于该企业的运维领域,满足该企业的特定需求。
它们之间的关系: 个人认为,从通用大模型到行业内的运维领域大模型,再到企业内运维大模型应该是逐渐深化、逐渐细化、逐渐专业化的过程。可以对标通用大模型、金融行业大模型、金融企业大模型的关系。行业内的运维领域大模型和企业内运维大模型的区别是针对通用大模型采用了不同的训练数据二次训练或者微调而已。前者,涉及的训练数据范围更广、数据更多,后者可能要加入某个企业自身的数据。前者可以凡凡地回答行业内的通识问题,后者可以满足企业自身运维应用需求.

4)毛亦凯 某股份制银行 大模型工程师
通用大模型、企业大模型的特点:

  • 通用大模型的特点:通用大模型是面向整个行业的,它包含了运维工作中的通用知识和技能。这意味着它可以为行业内的多家企业提供支持。由于其广泛的应用范围,通用大模型的训练数据来源非常广泛,可以覆盖行业内的各类运维场景。
  • 企业内运维大模型的特点:企业内运维大模型则更加具体和定制化,它针对特定企业的业务和运维流程进行了优化。这意味着它可以更好地满足企业的特定需求。由于其定制化的特性,企业内运维大模型的训练数据相对有限,更注重本企业的运维情景和需求。

虽然企业内运维大模型可以提供更加精准和定制化的服务,但使用适应企业发展的私有部署大模型也需要考虑企业的自身能力。因为无论是从物力还是人力上,这都是一笔较大的支出。企业在选择和使用这些模型时,需要综合考虑自身的资源、需求和技术能力。

三、议题共识总结

随着人工智能技术的快速发展,大模型在多个领域开始发挥重要作用。在运维领域,通用大模型、行业内的运维领域大模型和企业内运维大模型成为热议焦点。通用大模型具备强大的泛化能力,为运维提供广泛支持;行业运维大模型则针对特定行业优化,确保贴近实际应用;而企业运维大模型则更聚焦于企业需求,提供精准服务。这些模型在运维领域的应用前景广阔,将极大便利和提升运维效率。然而,企业在选择和使用时,需综合考虑资源、需求和技术能力,确保为企业带来最大价值。随着技术进步和应用场景拓展,期待大模型在运维领域发挥更大作用,推动数字化转型进程。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

5

添加新评论3 条评论

kevinshoppingkevinshopping科技信息经理某保险有限公司
2024-04-10 16:11
通用大模型有足够过的各行业数据知识,行业大模型具有行业内数据知识,而企业自有大模型更聚焦企业本身,覆盖企业内业务、系统、日志等数据,大模型针对运维提效是一个很不错的赋能点,特别针对企业安全运营有了大模型的加持定能让企业安全更上一层楼。
yyf123yyf123联盟成员系统工程师威海市商业银行
2024-04-10 15:47
训练数据通用大模型通常基于大规模的、多样化的数据集进行训练,这些数据集涵盖了各个领域的知识。而行业大模型则侧重于特定行业的专业知识,其训练数据主要来自于该行业的相关数据。至于企业内部的更是靠企业自身的数据进行训练,越来越聚焦。
wanggengwanggeng系统运维工程师某银行
2024-04-10 10:16
大模型下趋势下如何给运维进行赋能,也是一个非常重要的课题,期待有更多的大模型运维的内容和分享。
Ctrl+Enter 发表

本文隶属于专栏

活动总结
活动总结是社区交流活动内容的总结及延伸,为大家提供了社区专家们丰富且高水平的理论知识、实践经验以及常见问题的最佳解决方法,非常值得大家收藏学习。

作者其他文章

相关文章

相关问题

相关资料

X社区推广