大数据 - twt企业IT交流平台

订阅

领域

内容分类

大数据

大数据（Big Data），是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合。具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。

13152 会员关注

696 会员贡献

385 关系主题

问题

热度排序时间排序
问题

银行大数据平台·2024-04-26

大数据容器化部署如何实现资源隔离，与非容器相比的优势在什么地方？

课题专家组

· 民生银行　擅长领域：云计算, 容器, 容器云

25 会员关注

针对：大数据容器化部署如何实现资源隔离，与非容器相比的优势在什么地方？我是这么思考的，你可以看看是否有解答你的问题：通过宿主机的linux kernel实现优先级控制，确保资源使用优先级低于在线服务。与传统方式相比，容器化的大数据作业可以运行在在线应用使用的集群，利用在线集群...

浏览709

大数据·2024-04-23

大数据平台容器化部署后，原有大数据平台产品还需要吗？

课题专家组

· 民生银行　擅长领域：云计算, 容器, 容器云

25 会员关注

大数据平台容器化部署后，原有大数据平台产品还需要吗？其实这个问题是很多中小金融机构会面临遇到的问题，我是这样思考的希望能对你有帮助。存量的传统大数据集群产品还会保留，和容器化的大数据平台并行，但是不会再进行扩容了。新增作业都上容器化的大数据平台，可以和在线应用共...

浏览724

大数据·2024-04-23

请问大数据平台容器化后HDFS运行在哪里？

浏览505

银行Kubernetes·2024-04-23

容器云中flink类型的大数据存储方式？

课题专家组

· 民生银行　擅长领域：云计算, 容器, 容器云

25 会员关注

一般需要为计算节点配置单独的shaffle本地盘，同时通过调度算发，让数据密集型作业尽可能分散到不同的节点，确保不出现存储热点节点。同时也可以增加作业的内存配置和数量，减少spill到本地的文件数量，减少存储开销。...

浏览503

银行大数据·2024-04-23

生产应用容器弹性扩缩容使用？

浏览546

大数据平台·2024-03-08

关于用于建模和机器学习的技术方案？

课题专家组

· 昆仑银行　擅长领域：人工智能, 数据库, 大数据

5 会员关注

根据需求，主要是处理30亿条交易数据，并利用机器学习为交易地址打上标签，使用Hadoop和Spark是一个合适的大数据平台方案。数据量：Hadoop适合存储海量的数据，并提供了多种技术组件用于查询和分析，由于本需求是30亿条数据进行存储和处理，所以选择Hadoop是合适的。Spark是基于内存的...

浏览971

软件开发MySQL·2024-03-04

MySQL写到Redis读的过程是实时还是异步？

匿名用户

实时的。前端能实时读到写入redis的数据。

浏览2103

软件开发K8S·2024-02-28

数据通过canal同步到redis特别慢，是什么问题？

匿名用户

慢有两个地方，一个是redis这端，一个是写入那端。redis这端，redis是单线程的，一次同步很多数据是会比较慢；写入那端看看是否慢，看看是否可以改进。先优化慢，关键是看整个链路消耗的时间，定位出来之后去看是否可以优化。...

浏览1368

银行大语言模型·2024-01-15

与传统业务场景相比，大模型对数据存储资源的需求有哪些相同与不同之处？

朱祥磊 · 某移动公司　擅长领域：人工智能, 云计算, 容器

98 会员关注

相同之处：1. 数据存储需求量大：无论是传统业务场景还是大模型场景，都需要大规模存储数据，以满足业务需求。2. 数据安全性要求高：对于任何业务场景，数据的安全性和隐私保护都是重要的考虑因素。大模型也不例外，需要确保数据的安全性。3. 数据质...

浏览2324

银行大语言模型·2024-01-15

企业大模型数据治理你们更倾向哪些？并且可以说明选择倾向的理由？

课题专家组

· M　擅长领域：云计算, 存储, 私有云

429 会员关注

企业大模型数据治理是确保企业数据质量、安全性、可靠性和一致性的关键。在选择企业大模型数据治理的方法和工具时，我们更倾向于以下几个方面，并会说明相应的理由：数据质量管理和校验：我们强调数据质量管理和校验的重要性。通过数据清洗、格式转换和校验程序，可以确保数据的...

浏览2566

X社区推广