![面向智能客服等场景,银行大模型微调训练阶段如何设计百亿级/千亿级参数大模型分布式并行集群架构?](https://www.talkwithtrend.com/public_admin/upload_images/mediafile/2024-05/1716428077K3rQ.jpg)
活动简介
随着人工智能技术的快速发展,银行作为金融行业的重要组成部分,正面临前所未有的数字化转型机遇。智能客服作为提升客户体验、优化服务流程的关键环节,其背后的大模型微调与分布式并行集群架构设计显得尤为重要。
在银行数据量的激增和业务复杂度的提升的背景下,单节点计算已无法满足高效处理和实时响应的需求。分布式并行集群架构应运而生,它通过巧妙地将任务拆解并合理分配给众多节点同步执行,如同一台强大的引擎,大幅提升计算效率与吞吐量,让智能客服系统的响应速度与处理能力实现质的飞跃。如何设计好分布式并行集群架构是一个系统性的工作,要对大模型任务充分理解,还需要综合计算、存储和网络等基础设施多维度考量,任何一方都不能成为短板。
为了帮助银行AI架构师、大模型项目负责人能更好地应对客服场景大模型微调训练阶段IT架构设计的挑战,twt社区将在6月2日组织主题为“面向智能客服等场景,银行大模型微调训练阶段如何设计百亿级/千亿级参数大模型分布式并行集群架构?”线上封闭式赋能活动,将邀请到社区大模型课题专家组银行用户专家、华为存储专家进行深入解读和分享。欢迎社区银行AI架构师、大模型项目负责人报名参与!
本期的核心探讨议题:
议题一:分布式并行计算架构如何整体设计和优化提高集群性能和算力资源利用率?
议题二:异构GPU资源情况下,如何优化提高系统资源利用率?
活动时间:6月2日 14:00-16:30
活动形式:线上封闭会议
报名方式:
1、如您希望参与本次活动,请将您的联系信息(姓名、单位、职务、手机、邮箱)回复邮件至yan.sun@twtgroup.com.cn 进行邮件报名,我们将在1个工作日内审核反馈;
2、活动平台上直接点击报名,报名后我们会与您联系!
支持组织:
日程
时间 | 安排 |
---|---|
13:30-14:00 | 会前签到 |
14:00-14:15 | 开场kick off,全场自我介绍 |
14:15-14:55 | 银行行业客服场景大模型微调训练分布式并行集群架构设计关键点分享 |
14:55-15:35 | 银行大模型数据存储基础设施建设方案分享 |
15:35-16:25 | 互动交流 |
16:25-16:30 | 总结 |
嘉宾
用户主持人:
刘远圳 某股份制银行 AI产品经理
负责AI相关产品的研发、设计与应用推广工作。具备丰富的金融行业经验,深知AI技术在银行业务创新与客户服务提升中的核心价值。专注于挖掘AI技术在智能风控、智能客服、智能投顾等多个领域的应用潜力,致力于通过科技创新提升银行业务效率和客户满意度。
互动嘉宾:
苟志龙 某股份制银行 数据产品中心总监
历任算法和数据产品团队负责人。在模型建设、产品研发、文化规划等方面具有丰富经验。近年来,重点推动银行数字化转型,通过完善数据科学体系、孵化数据产品、培育数据文化等举措,提升全行数据驱动能力。本人为“北京市金融科技领军人才”获得者,名下多项创新成果已转化为商业价值,推动行内业务提质增效。
分享嘉宾
范容 某股份制银行 大数据研发部主管
在金融科技领域主要从事信息安全、大数据、物联网技术应用研发,并牵头开展银行数据安全管理、大数据风控模型、抵质押物物联网监管等金融科技的研究与创新应用工作,参与大数据风险管理及预警平台相关模型的设计与实现,主持对私客户反欺诈模型、互联网联合贷款产品风控/额度模型等模型建设。目前正在主持实施大语言模型应用落地工作。
严浩 华为 数据存储产品线AI存储总经理
2011年入职华为,现负责AI场景存储解决方案端到端管理。历任数据存储产品线金融SA总监、欧洲产品管理、闪存存储解决方案技术总监、数据库场景存储解决方案总经理等重要岗位。