Cui Xiaonan

Cui Xiaonan

DevRelNVIDIA英伟达（进入云社区）

动态

2023-04-25 · 回答了问题

大语言模型在金融机构如何逐步引进，对于中小机构，如何结合自身业务实际，进行有针对性地引入实施？

大语言模型对于算力和数据都提出来新的要求，建议初期从中小规模的模型起步，结合自身的业务需求，更多关注自身下游任务的打造，同时对于模型训练和推理部署的能力，也需要提前考虑。...

赞同
2023-04-18 · 发布了资料

NVIDIA AI Enterprise v3.1

评分 7.9

页数31

浏览5246

下载280

金币1
2022-04-28 · 回答了问题

GPU池化能力如何以及实现方案？

可以参考 https://docs.nvidia.com/ai-enterprise/deployment-guide/dg-advance-gpu.html

赞同
2022-04-28 · 回答了问题

容器和虚拟机混用环境下，同一个GPU资源可以同时对两者提供服务吗？

如果同一个GPU资源指的是同一张GPU卡，其实很难。个人观点，慢慢容器和虚拟化会趋同与同一个平台，大概率会是容器主导的技术方向，特别是在AI的技术路线上，可以更多关注K8S和GPU使用的结合。...

赞同
2022-04-28 · 回答了问题

如何提升gpu的资源利用率？

可以参考这个链接 https://docs.nvidia.com/ai-enterprise/deployment-guide/dg-advance-gpu.html

赞同
2022-04-28 · 回答了问题

gpu池化是基于物理机直接池化还是在gpu虚拟化的基础上进行池化？二者优缺点对比？

补充一个在GPU池化过程中需要注意的地方。GPU池化表面看起来CPU池化的效果是一样，但是本质有很大的区别，因为在CPU池化后，CPU直接彼此的工作是很少的，但是GPU完全不同，尤其是多张GPU在一些并行计算密集的地方，还需要集合NVL...

赞同 1
2022-04-28 · 回答了问题

GPU算力资源的分配颗粒度？

分享一个NVAIE手册里面的一个章节，分别提到了软硬GPU切分的一些颗粒度和技术细节，供大家参考： https://docs.nvidia.com/ai-enterprise/deployment-guide/dg-advance-gpu.html...

赞同
2022-04-28 · 回答了问题

容器云怎么直通加载显卡？

可以通过GPU Operator来实现 https://docs.nvidia.com/datacenter/cloud-native/contents.html

赞同
2022-04-28 · 回答了问题

容器云怎么做显卡切分？

关于GPU切分及高效共享的解决方案，行业有很多的技术实现，大致分成Remote CUDA，CUDA原生实现，GPU硬件实现。R-CUDA的方案，也叫远程CUDA和CUDA劫持，是一种基于驱动或CUDA句柄的拦截和转发机制，英伟达官方并不支持这样的做法，尤...

赞同
2022-04-28 · 回答了问题

在容器云环境建设和优化GPU资源池的过程？

可管理性，可靠性和可持续性都是在容器平台比较挑战的问题。可管理性涉及GPU资源的优化与高效的调度，建议参考NVAIE，即英伟达AI企业套件，包括了对于GPU资源池的管理和调度方式，同时对于目前主流的第三方和社区版本K8S都有很...

赞同

关于 Cui Xiaonan

用户名： bjitnan
职位： DevRel
公司： NVIDIA英伟达（进入云社区）
行业：互联网服务
地点：朝阳
社区声望：897
荣誉等级：LV.3

企业云社区

NVIDIA英伟达

NVIDIA英伟达

英伟达（NVIDIA）公司是全球视觉计算技术的行业领...

关注TA的人

更多关注TA的人 >>

最近来访

关于TWT 使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们
© 2024 talkwithtrend — talk with trend,talk with technologist 京ICP备09031017号-30

X社区推广