大数据涉及技术
大数据涉及技术
该主题还没有描述

问题

大数据平台·2024-03-08
jinhaibo课题专家组 · 昆仑银行 擅长领域:人工智能, 数据库, 大数据
4 会员关注
根据需求,主要是处理30亿条交易数据,并利用机器学习为交易地址打上标签,使用Hadoop和Spark是一个合适的大数据平台方案。数据量:Hadoop适合存储海量的数据,并提供了多种技术组件用于查询和分析,由于本需求是30亿条数据进行存储和处理,所以选择Hadoop是合适的。Spark是基于内存的...
银行大语言模型·2024-01-15
朱祥磊 · 某移动公司 擅长领域:人工智能, 云计算, 大数据
98 会员关注
相同之处:1.       数据存储需求量大:无论是传统业务场景还是大模型场景,都需要大规模存储数据,以满足业务需求。2.      数据安全性要求高:对于任何业务场景,数据的安全性和隐私保护都是重要的考虑因素。大模型也不例外,需要确保数据的安全性。3.      数据质...
银行大语言模型·2024-01-15
chinesezzqiang课题专家组 · M 擅长领域:云计算, 存储, 私有云
429 会员关注
企业大模型数据治理是确保企业数据质量、安全性、可靠性和一致性的关键。在选择企业大模型数据治理的方法和工具时,我们更倾向于以下几个方面,并会说明相应的理由:数据质量管理和校验 :我们强调数据质量管理和校验的重要性。通过数据清洗、格式转换和校验程序,可以确保数据的...
互联网服务大数据·2024-01-11
chinesezzqiang课题专家组 · M 擅长领域:云计算, 存储, 私有云
429 会员关注
在新的形势下,提升团队的数据资源运作能力变得尤为重要。以下是一些建议,有助于团队在这一方面取得进步:一、明确数据战略与目标制定明确的数据战略,确保团队对数据资源的运用与业务目标相一致。设定具体、可衡量的数据运作目标,以便团队能够有针对性地提升能力。二、加强数据...
大语言模型·2024-01-11
chinesezzqiang课题专家组 · M 擅长领域:云计算, 存储, 私有云
429 会员关注
企业关于数据湖、湖仓一体、数据仓库等统一数据平台在有效支持大模型应用方面,涉及一系列的经验、方法和难点。下面将对这些方面进行深入探讨:一、经验分享统一数据管理与治理 :企业应建立统一的数据管理平台,整合数据湖、湖仓一体和数据仓库,确保数据的统一存储、访问和管理...
银行大模型应用·2024-01-10
catalinaspring联盟成员 · 金融 擅长领域:人工智能, 数据库, 大数据
3 会员关注
几乎所有在线服务都在收集我们的个人数据,并可能将这些数据用于训练 LLM 。然而,模型会如何使用这些用于训练的数据则是难以确定的。如果在模型的训练中使用了诸如地理位置、健康记录、身份信息等敏感数据,那么针对模型中隐私数据的提取攻击( Data extraction attack )将会造...
银行大语言模型·2024-01-10
Jessie110联盟成员 · 先生 擅长领域:人工智能, 大数据, 数据湖
以场景落地为目标,缺啥整啥,没必要求大求全。
银行大语言模型·2024-01-10
xuyy联盟成员 · 秦皇岛银行 擅长领域:人工智能, 大数据, 数据库
9 会员关注
大模式如何与原有架构(如数据湖、湖仓一体、数据仓库)相结合,成为了企业架构中需要考虑的问题。企业需要对现有的数据架构进行全面的评估,了解其功能、数据处理能力、存储容量、查询性能等,有助于确定大模型与原有架构结合的方式和可行性。企业还需定义统一的集成接口标准,使大...
银行大语言模型·2024-01-10
chinesezzqiang课题专家组 · M 擅长领域:云计算, 存储, 私有云
429 会员关注
数据湖和湖仓一体在大模型训练方面可以发挥积极作用,主要体现在以下几个方面:首先,数据湖能够作为一个集中式存储平台,汇集大量不同来源、不同格式的数据。这对于大模型训练至关重要,因为大模型通常需要大量的数据进行训练,以捕捉数据的复杂模式和关联。数据湖能够提供一个统一...
银行大语言模型·2024-01-10
chinesezzqiang课题专家组 · M 擅长领域:云计算, 存储, 私有云
429 会员关注
大模型在运用传统结构化数据时,可以通过一系列步骤和方法来充分利用这些数据资源,提高模型的性能和应用效果。以下是一些关键步骤和考虑因素:数据准备与预处理 :数据清洗 :去除重复、错误或不完整的数据,确保数据的准确性和一致性。特征工程 :根据任务需求,从结构化数据中提取有...
X社区推广
  • 提问题