查看其它 4 个回答Eric雪飞的回答

Eric雪飞Eric雪飞存储专委 副主任上海市计算机学会

已经很明确的趋势是会分成两大类,通用大模型和垂直(行业)大模型。

通用大模型基本上是巨头的游戏,真正能在激烈竞争中胜出的参与者应该只是个位数。 国外的OpenAI+Microsoft,Google,Meta等几个互联网巨头,国内的百度阿里腾讯商汤字节。

垂直大模型就竞争激烈些,百模大战,国内基本都是这个做法:基于已经开源的模型,拿过来按照行业特色重新训练几个月或者仅是微调tuning一两个月,然后私有化部署卖集成方案。这里面行业机会非常多,不仅有初创企业,前面说的国内通用大模型玩家也大半会涉及进来,两头发力。还有就是有实力的甲方,可能自己也会做适配工作,毕竟模型的软件算法已经开源了,有数据集有GPU就能自己动手做。

如果说大模型本身的技术发展,现在有几个趋势是明确的,MoE混合专家架构的采用,多模态,RHLF过程去除人工介入,推理过程的效用增强,时延受控。内存管理和多维并行等。

具体可以看我最近写的文章,生成式AI与存储最新发展

IT其它 · 2023-09-07
浏览467

回答者

Eric雪飞
存储专委 副主任上海市计算机学会
擅长领域: 存储灾备分布式架构

Eric雪飞 最近回答过的问题

回答状态

  • 发布时间:2023-09-07
  • 关注会员:6 人
  • 回答浏览:467
  • X社区推广