大数据 - twt企业IT交流平台

大数据

大数据（Big Data），是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合。具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。

关注13152

热度排序时间排序
问题

银行大数据·19小时前

大数据作业容器化部署后日志收集、监控告警、异常诊断如何有效处理？

回答1

关注2

银行大数据·19小时前

容器化技术路线落地大数据混部后稳定性如何保障？部分服务要求有状态。？

回答

关注1

软件开发大数据·19小时前

容器化大数据混部后网络隔离策略如何做？离线任务短时间消耗大量的网络，如何避免在线业务不受影响？

回答

关注1

软件开发大数据·19小时前

容器化技术路线落地大数据混部技术选型应该时完全容器化还是部分容器化？

银行大数据·2024-04-28

· 民生银行　擅长领域：云计算, 容器, 容器云

25 会员关注

大数据框架组件的监控，可以复用容器平台原有对于在线容器的基础监控能力，并增加一些组件应用特性的状态类监控指标。作业层面，复用原有大数据作业的监控逻辑，监控队列里的作业状态，以及某一时间段（比如30分钟内）的作业失败率，超出预期则发出告警。...

银行大数据·2024-04-28

· 民生银行　擅长领域：云计算, 容器, 容器云

25 会员关注

如何实现业务容器与大数据容器的混合调度部署，两者的调度器的逻辑如何进行统一，以达到在保证安全生产的前提下，充分利用集群资源，降本增效。针对这个话题我谈谈我的建议：大数据作业通常需要独立的调度器，和在线业务的调度器独立，因为二者的调度逻辑有很大的差异。在线业务用缺...

银行大数据·2024-04-28

· 民生银行　擅长领域：云计算, 容器, 容器云

25 会员关注

关于大数据容器化会有比较专业的厂商或是业界比较成熟的方案，我也谈谈我在大数据和容器结合的一些实践经验给你参考：可以根据自己的实际情况和需要选择。但是前提是在线单集群的规模要足够大，单个节点的规格要足够高（最好是物理机）并且配置本地shaffle文件系统，这样才能承载...

银行大数据·2024-04-28

· 民生银行　擅长领域：云计算, 容器, 容器云

25 会员关注

大数据平台容器化后底层容器使用的还是k8s这一套，这个并没有改变。技术方案方案一般有2大类：一个大类是用k8s模拟yarn调度模式、一个大类是k8s原生调度方式。spark/flink社区主要支持k8s原生调度方式，我们因为历史原因选择用k8s模拟yarn调度模式。大数据容器化只有和混...

赞同

回答1

关注2

银行分布式存储·2024-04-26

大数据平台容器化混合部署，扩容弹性较云化+分布式存储相比的优势和提升在什么地方 ?

dean25

· 民生银行　擅长领域：云计算, 容器, 容器云

25 会员关注

大数据平台容器化混合部署，扩容弹性较云化+分布式存储相比的优势和提升在什么地方 ?针对你这个话题，我是这样的思考，你可以看看是否有解答：容器相比云化虚机，弹性能力是数量级的提升。大数据容器化后做混合部署，可以复用容器的弹性能力，实现大数据作业的serverless化，即无需为大...

赞同2

回答3

关注4

银行大数据平台·2024-04-26

K8S大数据平台部署，如何较云化或者本地化大数据平台提升系统稳定性和运行效率？

回答

关注1

订阅

领域

内容分类

热度排序时间排序
问题

订阅

领域

内容分类

热度排序时间排序问题

热度排序时间排序
问题