订阅

领域

内容分类

大数据
大数据(Big Data),是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合。具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
大数据(Big Data),是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合。具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。

热度排序时间排序
问题

银行大数据平台·2024-04-26
dean25课题专家组 · 民生银行 擅长领域:云计算, 容器, 容器云
25 会员关注
针对:大数据容器化部署如何实现资源隔离,与非容器相比的优势在什么地方?我是这么思考的,你可以看看是否有解答你的问题:通过宿主机的linux kernel实现优先级控制,确保资源使用优先级低于在线服务。与传统方式相比,容器化的大数据作业可以运行在在线应用使用的集群,利用在线集群...
大数据·2024-04-23
dean25课题专家组 · 民生银行 擅长领域:云计算, 容器, 容器云
25 会员关注
大数据平台容器化部署后,原有大数据平台产品还需要吗?其实这个问题是很多中小金融机构会面临遇到的问题,我是这样思考的希望能对你有帮助。存量的传统大数据集群产品还会保留,和容器化的大数据平台并行,但是不会再进行扩容了。新增作业都上容器化的大数据平台,可以和在线应用共...
银行Kubernetes·2024-04-23
dean25课题专家组 · 民生银行 擅长领域:云计算, 容器, 容器云
25 会员关注
一般需要为计算节点配置单独的shaffle本地盘, 同时通过调度算发,让数据密集型作业尽可能分散到不同的节点,确保不出现存储热点节点。 同时也可以增加作业的内存配置和数量,减少spill到本地的文件数量,减少存储开销。...
大数据平台·2024-03-08
jinhaibo课题专家组 · 昆仑银行 擅长领域:人工智能, 数据库, 大数据
5 会员关注
根据需求,主要是处理30亿条交易数据,并利用机器学习为交易地址打上标签,使用Hadoop和Spark是一个合适的大数据平台方案。数据量:Hadoop适合存储海量的数据,并提供了多种技术组件用于查询和分析,由于本需求是30亿条数据进行存储和处理,所以选择Hadoop是合适的。Spark是基于内存的...
软件开发MySQL·2024-03-04
匿名用户
实时的。前端能实时读到写入redis的数据。
软件开发K8S·2024-02-28
匿名用户
慢有两个地方,一个是redis这端,一个是写入那端。redis这端,redis是单线程的,一次同步很多数据是会比较慢;写入那端看看是否慢,看看是否可以改进。先优化慢,关键是看整个链路消耗的时间,定位出来之后去看是否可以优化。...
银行大语言模型·2024-01-15
朱祥磊 · 某移动公司 擅长领域:人工智能, 云计算, 容器
98 会员关注
相同之处:1.       数据存储需求量大:无论是传统业务场景还是大模型场景,都需要大规模存储数据,以满足业务需求。2.      数据安全性要求高:对于任何业务场景,数据的安全性和隐私保护都是重要的考虑因素。大模型也不例外,需要确保数据的安全性。3.      数据质...
银行大语言模型·2024-01-15
chinesezzqiang课题专家组 · M 擅长领域:云计算, 存储, 私有云
429 会员关注
企业大模型数据治理是确保企业数据质量、安全性、可靠性和一致性的关键。在选择企业大模型数据治理的方法和工具时,我们更倾向于以下几个方面,并会说明相应的理由:数据质量管理和校验 :我们强调数据质量管理和校验的重要性。通过数据清洗、格式转换和校验程序,可以确保数据的...
  • 分类
  • 信息
  • 领域
  • X社区推广