互联网服务大数据 spark rdd

在使用spark计算引擎时，如何创建RDD？

1、RDD是Spark的核心数据模型，但是个抽象类，全称为Resillient Distributed Dataset，即弹性分布式数据集。
2、RDD在抽象上来说是一种元素集合，包含了数据。它是被分区的，分为多个分区，每个分区分布在集群中的不同节点上，从而让RDD中的数据可以被并行操作。

如何在编写spark程序中创建RDD?

参与10

2同行回答
%E4%BA%92%E8%81%94%E7%BD%91%E6%9C%8D%E5%8A%A1
全部行业 互联网服务
|
按赞同排序
按时间排序

提问者

软件架构设计师某券商

擅长领域：大数据，数据库，数据仓库

评论55

问题来自

活动 - 大数据组件解析及如何选择合适的大数据组件搭建大数据平台在线答疑

相关问题

金融机构可以采取哪些措施来保障大数据时代下的数据安全？

中小银行的数据安全分类分级如何做？

大数据实时数仓构建一般选型技术方案是怎样的？

医院科研大数据平台，对临床医生要能真正有所帮助，无论是数据还是图像？

临床数据中心必须符合医院的数据管理规范？

相关资料

“十四五”大数据产业发展规划

构建RAC架构及异地单机Data_Guard实施文档

头豹：2022年中国大数据产业一级市场纵览

Ansible运维管理平台部署、维护与调优

企业数据中台建设方案

相关文章

迈入ChatGPT时代商业银行AI应用的发展趋势分析

大数据时代下，金融行业数据安全防护面临挑战与落地措施探讨

河南农商联合银行招大数据风控、软件开发、网络安全等专业人才(郑州）

招聘 | 苏州农商银行金融科技部、数字银行部发布6个岗位

某城商行数据中台压测收获

问题状态

发布时间：2018-10-18

关注会员：2 人

问题浏览：3418

最近回答：2018-10-19

关于TWT 使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们
© 2024talkwithtrend — talk with trend,talk with technologist 京ICP备09031017号-30

X社区推广