订阅

领域

内容分类

大数据
大数据(Big Data),是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合。具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
大数据(Big Data),是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合。具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。

热度排序时间排序
问题

银行大数据·2024-04-28
dean25课题专家组 · 民生银行 擅长领域:云计算, 容器, 容器云
25 会员关注
大数据框架组件的监控,可以复用容器平台原有对于在线容器的基础监控能力,并增加一些组件应用特性的状态类监控指标。 作业层面,复用原有大数据作业的监控逻辑,监控队列里的作业状态,以及某一时间段(比如30分钟内)的作业失败率,超出预期则发出告警。...
银行大数据·2024-04-28
dean25课题专家组 · 民生银行 擅长领域:云计算, 容器, 容器云
25 会员关注
如何实现业务容器与大数据容器的混合调度部署,两者的调度器的逻辑如何进行统一,以达到在保证安全生产的前提下,充分利用集群资源,降本增效 。针对这个话题我谈谈我的建议:大数据作业通常需要独立的调度器,和在线业务的调度器独立,因为二者的调度逻辑有很大的差异。在线业务用缺...
银行大数据·2024-04-28
dean25课题专家组 · 民生银行 擅长领域:云计算, 容器, 容器云
25 会员关注
关于大数据容器化会有比较专业的厂商或是业界比较成熟的方案 ,我也谈谈我在大数据和容器结合的一些实践经验给你参考:可以根据自己的实际情况和需要选择。 但是前提是在线单集群的规模要足够大,单个节点的规格要足够高(最好是物理机)并且配置本地shaffle文件系统,这样才能承载...
银行大数据·2024-04-28
dean25课题专家组 · 民生银行 擅长领域:云计算, 容器, 容器云
25 会员关注
大数据平台容器化后底层容器使用的还是k8s这一套,这个并没有改变。 技术方案方案一般有2大类: 一个大类是用k8s模拟yarn调度模式、一个大类是k8s原生调度方式。spark/flink社区主要支持k8s原生调度方式,我们因为历史原因选择用k8s模拟yarn调度模式。大数据容器化只有和混...
银行分布式存储·2024-04-26
dean25课题专家组 · 民生银行 擅长领域:云计算, 容器, 容器云
25 会员关注
大数据平台容器化混合部署,扩容弹性较云化+分布式存储相比的优势和提升在什么地方 ?针对你这个话题,我是这样的思考,你可以看看是否有解答:容器相比云化虚机,弹性能力是数量级的提升。大数据容器化后做混合部署,可以复用容器的弹性能力,实现大数据作业的serverless化,即无需为大...
  • 分类
  • 信息
  • 领域
  • X社区推广