什么是spark?
Spark是hadoop的计算框架,是由伯克利大学最初设计的算法,使得计算基本都在内存中进行,用于加速传统的MapReduce,特别shuffing的过程。目前很多大数据平台都采用这个计算框架。
如果你对hadoop的MR有所理解,你就将Spark想象成MR过程中的数据都是在内存中处理的
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30