大数据处理
大数据处理
大数据处理大致可分为四步:采集,导入/预处理,统计/分析,挖掘
大数据处理大致可分为四步:采集,导入/预处理,统计/分析,挖掘

最新

机器学习·2024-03-08
jinhaibo课题专家组 · 昆仑银行 擅长领域:人工智能, 数据库, 大数据
4 会员关注
根据需求,主要是处理30亿条交易数据,并利用机器学习为交易地址打上标签,使用Hadoop和Spark是一个合适的大数据平台方案。数据量:Hadoop适合存储海量的数据,并提供了多种技术组件用于查询和分析,由于本需求是30亿条数据进行存储和处理,所以选择Hadoop是合适的。Spark是基于内存的...
jason2006xu · 昆仑银行 擅长领域:系统运维, 监控, 云计算
45 会员关注
1、背景随着业务创新以及分布式架构、微服务、大数据、人工智能等技术演进,使得银行业IT运维面临软硬件数量激增、应用和架构复杂化、变更频繁、调用链显著增长、运维数据井喷等困难和挑战。运维技术在各行各业的重要性越来越高,特别在商业银行使用更广、更深,由于商业银行...(more)
专栏: 趋势观点
浏览1374
评论7
银行大语言模型·2024-01-15
朱祥磊 · 某移动公司 擅长领域:人工智能, 云计算, 大数据
98 会员关注
相同之处:1.       数据存储需求量大:无论是传统业务场景还是大模型场景,都需要大规模存储数据,以满足业务需求。2.      数据安全性要求高:对于任何业务场景,数据的安全性和隐私保护都是重要的考虑因素。大模型也不例外,需要确保数据的安全性。3.      数据质...
银行大语言模型·2024-01-10
在长尾场景下,数据清洗是至关重要的。以下是清洗长尾数据的方法、措施和注意点:异常值处理:长尾数据中常见异常值,可利用统计学方法处理异常值,确保数据准确性。缺失值处理:长尾数据可能存在较多缺失值,需采用适当方法填充或处理,如均值填充、插值法等,以保证数据完整性。特征选择...
医院数据安全·2023-12-26
nkj827 · 长春长信华天 擅长领域:存储, 灾备, 服务器
767 会员关注
数据存储是数据安全的最后一道防线,如何发挥存储在数据安全的作用?要从以下几个方面考虑:1.加密存储:对数据进行加密存储是一种有效的保护措施。通过加密,可以确保即使数据被窃取或泄露,也无法被未经授权的第三方轻易解密和使用。可以采用对称加密、非对称加密、哈希加密等真...
医院存储·2023-11-07
mxin · 上海宝信软件股份有限公司 擅长领域:存储, 灾备, 服务器
480 会员关注
要有效控制医学影像数据的存储成本,可以考虑以下几个方面:数据压缩和优化:使用高效的压缩算法对图像进行压缩,以减少存储空间的需求。此外,还可以通过去除冗余信息、调整图像分辨率等方式进一步减小数据大小。归档和删除策略:制定合理的数据归档和删除策略,将不常使用的数据转移...

    描述

    大数据处理大致可分为四步:采集,导入/预处理,统计/分析,挖掘
    大数据处理大致可分为四步:采集,导入/预处理,统计/分析,挖掘
    X社区推广
  • 提问题