大数据处理 - 主题 - twt企业IT交流平台

问题
热度排序 时间排序

银行数据存储·2022-11-24

SRDF是否只支持存储间传输备份，不支持存储与固态硬盘？

zftang · 小白一枚　擅长领域：数据库, 云计算, 服务器

65 会员关注

支持存储间传输备份

赞同1

回答2

关注3

机械装备数据存储·2022-02-16

保险行业的互联网渠道业务数据存储有哪些建议解决方案？

asuro · 太平洋保险　擅长领域：存储, 灾备, 软件定义存储

可以考虑采用分布式对象存储做为后端支持，针对回查时间久的问题，需要具体分析其潜在瓶颈，有针对性的做方案设计。

赞同1

回答2

关注4

系统集成数据采集·2022-07-13

housekeeping那个有什么优化的办法吗？减少数据采集周期能不能达到优化的效果？

lych370

· 个人　擅长领域：数据库, 云计算, 服务器

18 会员关注

看服务器的性能吧，减少采集周期肯定能够提高效率的，但是会影响采集数据的粒度，这些问题我觉得不适合单独拿出来探讨，主要还是要综合考虑，是要节省成本，还是要数据精度为主，housekeeping本身没有多大的影响...

赞同

回答2

关注3

银行数据存储·2022-02-21

根据存储类别与技术特点分析如何划分应用数据存储位置？

amany · zes　擅长领域：大数据, 存储, 数据库

一般情况下，分布式块适合做业务的资源池底座，比如虚拟机、容器镜像存储等；分布式文件适合高IO访问场景，支持数据快速访问，高效率处理。而对象有很好的扩展性，适合用来做大容量的数据归档、离线分析等业务。...

赞同2

回答1

关注2

IT咨询服务spark·2022-12-05

能否推荐一下大数据spark在冶金制造业相关项目经验和书籍？

匿名用户

对于大数据Spark在治金制造业的应用，建议可以阅读以下书籍和文献:1.《Spark大数据处理技术实战》: 该书透彻介绍了Spark的基础知识、数据处理流程和常见应用场景，并结合实际案例详解了Spark在工业领域 (包括制造业)中的应用。2.《大数据处理技术及其在治金制造业中的应用》...

赞同1

回答1

关注2

机械装备双录平台·2022-02-16

保险行业双录平台的数据的存储能否给一些建议解决方案？

richardhandr · 戴尔科技金融行业解决方案中心　擅长领域：存储, 灾备, 双活

4 会员关注

目前比较主流的是采用对象存储，规模小可以考虑分布式NAS或者就是简单的NAS。

IT咨询服务大数据·2022-12-02

zftang · 小白一枚　擅长领域：数据库, 云计算, 服务器

65 会员关注

executor是真正执行task地方，而task执行离不开具体的数据，这些task运行的结果可以是shuffle中间结果，也可以持久化到外部存储系统。一般都是将结果、状态等汇集到driver。但是，目前executor之间不能互相通信，只能借助第三方来实现数据的共享或者通信。...

赞同

回答1

关注2

银行spark·2024-05-07

大数据与日常应用容器化混合部署，如何合理分配资源？

dean25

· 民生银行　擅长领域：云计算, 容器, 容器云

25 会员关注

离线在线混合部署后，主要是错峰运行。夜间(22:00-8:00)之间是在线的低谷期，可以出让较多的CPU计算资源给大数据，比如40%-45%。白天(8:00-18:00) 是在线应用的高峰期，可以出让比如15%-20%的资源给大数据作业；晚上(18:00-22:00)在线业务负载相比白天下降，可以出让30%的资源给大...

赞同

回答1

关注2

基金证券核心交易系统·2021-05-25

如何解决解决长期保留数据存储介质的维护、验证和可用性的问题？