大数据处理
大数据处理
大数据处理大致可分为四步:采集,导入/预处理,统计/分析,挖掘
大数据处理大致可分为四步:采集,导入/预处理,统计/分析,挖掘

问题

机器学习·2024-03-08
jinhaibo课题专家组 · 昆仑银行 擅长领域:人工智能, 数据库, 大数据
4 会员关注
根据需求,主要是处理30亿条交易数据,并利用机器学习为交易地址打上标签,使用Hadoop和Spark是一个合适的大数据平台方案。数据量:Hadoop适合存储海量的数据,并提供了多种技术组件用于查询和分析,由于本需求是30亿条数据进行存储和处理,所以选择Hadoop是合适的。Spark是基于内存的...
银行大语言模型·2024-01-15
朱祥磊 · 某移动公司 擅长领域:人工智能, 云计算, 大数据
98 会员关注
相同之处:1.       数据存储需求量大:无论是传统业务场景还是大模型场景,都需要大规模存储数据,以满足业务需求。2.      数据安全性要求高:对于任何业务场景,数据的安全性和隐私保护都是重要的考虑因素。大模型也不例外,需要确保数据的安全性。3.      数据质...
银行大语言模型·2024-01-10
在长尾场景下,数据清洗是至关重要的。以下是清洗长尾数据的方法、措施和注意点:异常值处理:长尾数据中常见异常值,可利用统计学方法处理异常值,确保数据准确性。缺失值处理:长尾数据可能存在较多缺失值,需采用适当方法填充或处理,如均值填充、插值法等,以保证数据完整性。特征选择...
医院数据安全·2023-12-26
nkj827 · 长春长信华天 擅长领域:存储, 灾备, 服务器
767 会员关注
数据存储是数据安全的最后一道防线,如何发挥存储在数据安全的作用?要从以下几个方面考虑:1.加密存储:对数据进行加密存储是一种有效的保护措施。通过加密,可以确保即使数据被窃取或泄露,也无法被未经授权的第三方轻易解密和使用。可以采用对称加密、非对称加密、哈希加密等真...
医院存储·2023-11-07
mxin · 上海宝信软件股份有限公司 擅长领域:存储, 灾备, 服务器
480 会员关注
要有效控制医学影像数据的存储成本,可以考虑以下几个方面:数据压缩和优化:使用高效的压缩算法对图像进行压缩,以减少存储空间的需求。此外,还可以通过去除冗余信息、调整图像分辨率等方式进一步减小数据大小。归档和删除策略:制定合理的数据归档和删除策略,将不常使用的数据转移...
银行大语言模型·2023-09-06
xuyy联盟成员 · 秦皇岛银行 擅长领域:人工智能, 大数据, 数据库
9 会员关注
数据清洗的步骤 (1)数据收集:从不同来源收集数据,包括客户信息、交易记录、市场数据等。 (2)数据预处理:对数据进行初步清洗,包括去除重复数据、缺失值处理、异常值处理等。 (3)数据整合:将不同数据源的数据整合到一起,确保数据的一致性和完整性。 (4)数据验证:对数据进...
硬件生产集中式存储·2023-08-21
chengg1112 · 联泰信息 擅长领域:存储, 备份, 数据安全
1 会员关注
必须华为啊,华为存储成立之初,到现在已经有10年之久了,从客户的反馈及故障率来说,都算不错,相信华为,不会让你失望
硬件生产国产芯片选型·2023-08-21
朱向东课题专家组 · 某银行 擅长领域:服务器, 存储, 数据库
51 会员关注
在数据存储选型中,国产CPU的选择对于整体系统性能和兼容性是非常重要的因素之一。CPU作为数据存储设备的计算和控制核心,它的性能和特性将直接影响到数据存储系统的处理能力、响应时间和可靠性。以下是在数据存储设备选型时需要考虑的一些关键点:1、评估数据存储的性能需求,...
基金国产数据库·2023-07-28
朱向东课题专家组 · 某银行 擅长领域:服务器, 存储, 数据库
51 会员关注
针对不同国产数据库数据存储介质选型,需要综合考虑多个方面的因素,包括业务需求、数据量、性能要求、可靠性、成本等因素。在这些因素中,存储介质的选型直接影响数据库的性能和可靠性,因此,选型时需要谨慎考虑。在一般情况下,本地盘、SAN存储和NAS存储都可以作为数据库的存储介...
银行大语言模型·2023-07-07
wenwen123 · MM 擅长领域:人工智能, 云计算, 数据库
6 会员关注
ChatGLM-6B 是基于 GPT-3.5 架构的大型语言模型,它使用了 6B 个参数进行训练。底层算法逻辑基本上遵循 GPT-3.5 的设计原则,主要分为两个部分:Transformer 架构和自回归生成。Transformer 架构是一种基于自注意力机制的神经网络架构,用于处理输入的文本序列。它由多个编码器...

描述

大数据处理大致可分为四步:采集,导入/预处理,统计/分析,挖掘
大数据处理大致可分为四步:采集,导入/预处理,统计/分析,挖掘
X社区推广
  • 提问题