能源采矿边缘计算

查看其它 2 个回答Cui Xiaonan的回答

企业级应用中,在很多方面的考量都以稳定性作为第一要素,高可靠性(24*7)及业务连续性一直是企业IT中出现频率最高的词条,对于智能化的应用,英伟达对于系统整体的稳定性和可靠性也会有对应的解决方案,分别从GPU,嵌入式及整体系统三个方面,阐述英伟达在稳定性和可靠性方面的理解。

第一,GPU,分为消费类产品和企业级产品,譬如大家经常听到的2080,2080 Ti,3070,3080,3090等等Geforce系列的明星产品,都属于消费类的产品。Tesla V100,T4, A100,A30,A10,A16,RTX4000/5000/6000, RTX A4000/5000/6000 等产品属于企业级产品线,他们之间有着很大的差距, 消费类产品绝大部分均采用 ODM的方式,英伟达仅提供 GPU核心的设计和芯片,ODM厂商自己完成显卡的成品设计,生产,品控,营销及保修流程,打个比喻,您手里的英伟达Geforce 2080Ti GPU,也许并不是英伟达生产的产品,一般会称为非公版(公版GPU,数量少,仅在产品推广期由英伟达生产制造并少量投放市场 ), 所以英伟达也不会对其进行任何的技术支持,特别是在AI 应用的方面 ,我们的工具链和技术支持更专注于企业级 GPU。消费类GPU在产品的设计方面, 主要面向广大的游戏玩家 ,所以在产品设计上会追求其计算峰值,这个也比较容易理解,一般复杂的3D游戏画面仅会在连续几秒钟或若干帧中出现,并不会持续到若干小时,这就要求GPU在处理图形加速的过程中可以支持到短暂的性能尖峰,整体性能的输出也会呈现波浪式的形态,为了追求这种计算尖峰,显卡会牺牲掉数据校验等额外性能开销的计算校验过程,在一个高清的一帧画面中,若干的计算数位错误对于肉眼几乎是无法识别的,为了追求高性能,消费类GPU的主频均高于企业级GPU, 也带来了散热及功耗的问题 ,会直接影响运行的可靠性和稳定性,在GPU运行环境和驱动方面, 企业级GPU会有稳定的测试,更紧密的版本迭代周期,对于企业多采用的Linux操作系统和容器环境有更好的支持,消费类GPU提供1年ODM保修,企业级GPU英伟达提供3年保修的政策。企业级GPU由英伟达提供设计到生产的整个环节,品控及稳定均要高于消费类产品,对于GPU上运行的AI应用及SDK提供全工具链可以得到英伟达原厂技术团队的支持。 ​

第二,嵌入式架构未来在边缘侧的崛起,嵌入式SoC(system on chip)采用更加紧凑且低功耗的设计,在边缘侧部署灵活,同时集成了底层操作系统和驱动,对于稳定 性和可靠性得到了极大的保障,支持异构计算加速能力,特别是GPU的AI能力的集成,使得在边缘侧部署智能化的应用成为可能性, 随着未来Jetson ORIN系列芯片模组的推出,在边缘侧的AI算力可以轻松突破200TOPS,结合嵌入式架构的可靠稳定低功耗的特点,在工业场景的应用中,对于目前大量采用的工控机(IPC + GPU)的形态, 将会是一个很好的嵌入式解决方案。 譬如:一个功耗50w左右,拥有ARM CPU和高算力的GPU边缘计算单元(盒子 )将有可能完全替代现有的工控机 ,在制造的生产线旁,采集设备产生的数据,实时处理并分析,通过GPU高速的并行加速能力,结合英伟达DeepStream和TensorRT等加速推理软件,实现实时的工业缺陷检测及其他应用场景 。

第三,整体系统方面,英伟达的EGX企业边缘加速平台中,推出了英伟达认证的服务器,由于边缘GPU加速的应用相比传统的企业级应用,需要更多元化更复杂的计算能力和软件堆栈的支持,包括CPU,GPU和DPU之间的配合与优化。分布于边缘侧的计算平台,对于管理和安全性的要求会更高,要求系统具备企业级的稳定性和可靠性。 英伟达与主流的服务器厂商进行了认证和适配工作,预先在多种配置组合的服务器中,完成了从AI,数据分析,视频分析,图形加速,数据安全等全面的测试,为客户智能化应用的落地提供了稳定可靠的基础保障。

互联网服务 · 2021-07-28
浏览1150

回答者

Cui Xiaonan 最近回答过的问题

回答状态

  • 发布时间:2021-07-28
  • 关注会员:5 人
  • 回答浏览:1150
  • X社区推广