spark - 主题 - twt企业IT交流平台

spark

spark

Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架，Spark，拥有Hadoop MapReduce所具有的优点；但不同于MapReduce的是Job中间输出结果可以保存在内存中，从而不再需要读写HDFS，因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。Spark 是一种与 Hadoop 相似的开源集群计算环境，但是两者之间还存在一些不...(more)

378 会员关注

137 会员贡献

23 关系主题

问题

问题
热度排序 时间排序

互联网服务数据库·2015-02-12

hadoop与spark的区别

课题专家组

· 某科技公司　擅长领域：数据库, 服务器, 人工智能

234 会员关注

回复 1# cloudsher 简单的来说，spark是使用内存的hadoop，让数据运算速度更快。spark底层也是使用的mr，需要了解Hadoop，并且spark也是基于hadoop上的产品，学习建议从hadoop学起。

浏览2764

电信运营商数据库·2015-02-12

课题专家组

· 某科技公司　擅长领域：数据库, 服务器, 人工智能

234 会员关注

回复 1# 月光无寒推荐系统有使用hadoop做用户画像，配合流式计算做实时的个性化推荐。

浏览3116

互联网服务数据库·2015-02-11

spark+graphx方案在生产环境中的响应时间

课题专家组

· 某科技公司　擅长领域：数据库, 服务器, 人工智能

234 会员关注

回复 1# arise 响应时间大概在秒级。可以实现online应用。数据数量及在p级。 node数量不限，目前国内最大的在5000台。最短路径的平均响应时间不确定。国内目前使用Neo4j的不多。

浏览2020

软件开发数据库·2015-02-11

hadoop与spark的关系？

课题专家组

· 某科技公司　擅长领域：数据库, 服务器, 人工智能

234 会员关注

回复 1# Lee_185216 spark基于hadoop。

浏览3655

系统集成大数据·2014-12-11

为什么Spark发展不如Hadoop?

一说大数据，人们往往想到Hadoop。这固然不错，但随着大数据技术的深入应用，多种类型的数据应用不断被要求提出，一些Hadoop被关注的范畴开始被人们注意，相关技术也迅速获得专业技术范畴的应用。最近半年来的Spark之热就是典型例子。　　Spark是一个基于RAM计算的开源码ComputerC...(more)

浏览26638

IT其它大数据·2014-07-29

不懂Hadoop/Hive/Storm/Spark/Hbase/Mahout/R等等，可以做大数据吗？

敏捷大数据应用开发者大会(2014)(2014年8月7号上海- 杨浦)==================================================================================不懂Hadoop/Hive/Storm/Spark/Hbase/Mahout/R等等，可以做大数据吗？大家都知道，目前实施大数据项目，需要基于以Hadoop为代表的框...(more)

浏览1796

描述

Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架，Spark，拥有Hadoop MapReduce所具有的优点；但不同于MapReduce的是Job中间输出结果可以保存在内存中，从而不再需要读写HDFS，因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。Spark 是一种与 Hadoop 相似的开源集群计算环境，但是两者之间还存在一些不...(more)

378 会员关注

137 会员贡献

23 关系主题

主题组织结构热门关系主题

关注330 大数据分析

关注593 大数据产品

关注分布式数据库产品

关注大数据平台涉及产品

关注54 OceanBase

关注29 GoldenDB

关注63 elasticsearch

关于TWT 使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们
© 2024talkwithtrend — talk with trend,talk with technologist 京ICP备09031017号-30

X社区推广

关注主题378