大数据处理
大数据处理
大数据处理大致可分为四步:采集,导入/预处理,统计/分析,挖掘
大数据处理大致可分为四步:采集,导入/预处理,统计/分析,挖掘

问题

银行银行日志分析系统·2019-06-12
jwhdhr · 农商银行 擅长领域:数据库, 中间件, 消息中间件
25 会员关注
在日志分析系统中实时性是一个难点问题,比如实时任务1分钟只能处理30秒采集的数据,那么产出的数据的延时会越来越长,不能代表当前时刻的业务状态,有可能导致业务方做出错误的运营决策。在互联网行业中,需要处理的数据是海量的,如何在数据量快速膨胀的情况下也能保持高吞吐量和...
银行大语言模型·2024-01-10
在长尾场景下,数据清洗是至关重要的。以下是清洗长尾数据的方法、措施和注意点:异常值处理:长尾数据中常见异常值,可利用统计学方法处理异常值,确保数据准确性。缺失值处理:长尾数据可能存在较多缺失值,需采用适当方法填充或处理,如均值填充、插值法等,以保证数据完整性。特征选择...
银行大语言模型·2024-01-15
朱祥磊 · 某移动公司 擅长领域:人工智能, 云计算, 容器
98 会员关注
相同之处:1.       数据存储需求量大:无论是传统业务场景还是大模型场景,都需要大规模存储数据,以满足业务需求。2.      数据安全性要求高:对于任何业务场景,数据的安全性和隐私保护都是重要的考虑因素。大模型也不例外,需要确保数据的安全性。3.      数据质...
银行数据备份·2023-06-08
yaohongbo · 中信银行 擅长领域:存储, 备份, 数据安全
4 会员关注
1、你有没有专门的历史数据归档系统?有的话,复用这个归档系统。好处是有接口,有规范,可以按归档系统的设计存放,取用方便。一般来说都是磁盘介质,底层可能是对象存储或者hadoop。管理维护由归档系统统一完成。2、有没有集中备份系统?备份系统的几种介质都可以,比如磁带,磁盘,PBB专...
银行数据备份·2023-06-13
朱向东课题专家组 · 某银行 擅长领域:服务器, 存储, 数据库
53 会员关注
针对银行业在进行数据备份和存储时,一般会采用多种技术和物理介质,具体选择的备份介质和存储技术应该根据业务需求、数据量和安全性要求等因素进行综合考虑。通常可以选择虚拟带库、物理带库、蓝光光盘库、对象存储、备份一体机等。具体选择什么技术,应该站在全局角度去整体...
基金数据库·2023-07-28
朱向东课题专家组 · 某银行 擅长领域:服务器, 存储, 数据库
53 会员关注
针对不同国产数据库数据存储介质选型,需要综合考虑多个方面的因素,包括业务需求、数据量、性能要求、可靠性、成本等因素。在这些因素中,存储介质的选型直接影响数据库的性能和可靠性,因此,选型时需要谨慎考虑。在一般情况下,本地盘、SAN存储和NAS存储都可以作为数据库的存储介...
银行国产数据库·2023-01-06
lych370联盟成员 · 个人 擅长领域:数据库, 云计算, 服务器
17 会员关注
目前用过的有中兴的golden db和pcap的tidb,腾讯和阿里也都有自己的数据库产品
医院数据安全·2023-12-26
nkj827 · 长春长信华天 擅长领域:存储, 灾备, 服务器
770 会员关注
数据存储是数据安全的最后一道防线,如何发挥存储在数据安全的作用?要从以下几个方面考虑:1.加密存储:对数据进行加密存储是一种有效的保护措施。通过加密,可以确保即使数据被窃取或泄露,也无法被未经授权的第三方轻易解密和使用。可以采用对称加密、非对称加密、哈希加密等真...
机械装备容器云·2022-07-22
lych370联盟成员 · 个人 擅长领域:数据库, 云计算, 服务器
17 会员关注
跟云下一样,数据单独挂存储卷,然后把数据定时卸到数仓,做大数据处理
银行数据分析·2023-03-18
zftang · 小白一枚 擅长领域:数据库, 云计算, 服务器
64 会员关注
隐私计算数据沙箱

描述

大数据处理大致可分为四步:采集,导入/预处理,统计/分析,挖掘
大数据处理大致可分为四步:采集,导入/预处理,统计/分析,挖掘
X社区推广
  • 提问题