spark
spark
Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不...(more)
Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越,换句话说,Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。

问题

互联网服务Redis·2017-05-04
Wentasy · ChainONE 擅长领域:数据库, 大数据, 内存数据库
76 会员关注
直接连接的是真实的 Redis?你需要的是高可用方案。参考:http://www.aixchina.net/Question/230971
系统集成数据中心·2017-04-25
较Spark等5种大数据框架,基于Hadoop的数据中心的好处是什么?
浏览5980
互联网服务spark·2017-04-25
美国队长 · Alibaba 擅长领域:大数据, 大数据平台, 数据库
511 会员关注
主节点没连接上去,不知道你本地有没有搭建spark的开发环境
互联网服务Hadoop·2017-04-24
美国队长 · Alibaba 擅长领域:大数据, 大数据平台, 数据库
511 会员关注
spark跟hadoop用在不同的场景,spark用在实时吃内存,如果项目小或者考虑成本再加上对数据查询速度要求不高,就可以用hadoop,成本低,配置不要求搞
能源采矿应用场景·2017-01-11
liucj2004 · undefined 擅长领域:数据库, 数据库系统改造, 关系型数据库
441 会员关注
适合快速开发、简单部署、需要横向扩展等具体案例如下1、电商平台(如小红书、唯品会)2、移动应用(如快的打车)3、CMS内容管理(如adboe exprience manager)4、海量日志分析(如360)5、基于hadoop/spark的大数据的协作(如东航下一代旅客服务系统)6、还有各种手游网游爬虫等等内存直接...
银行应用场景·2017-01-09
liucj2004 · undefined 擅长领域:数据库, 数据库系统改造, 关系型数据库
441 会员关注
1、电商平台(如小红书、唯品会)2、移动应用(如快的打车)3、CMS内容管理(如adboe exprience manager)4、海量日志分析(如360)5、基于hadoop/spark的大数据的协作(如东航下一代旅客服务系统)6、还有各种手游网游爬虫等等...
系统集成datastage·2016-10-24
datastage可以对接spark平台吗?有无实施过的企业案例
浏览4005
银行spark·2016-09-21
ZengGang · 浪潮商用机器有限公司 擅长领域:服务器, 云计算, 数据库
101 会员关注
www    smartercu   com
银行应用场景·2016-09-21
ZengGang · 浪潮商用机器有限公司 擅长领域:服务器, 云计算, 数据库
101 会员关注
应用很多,比如历史数据查询;金融信贷风控;金融欺诈侦测;征信平台;流动性管理;内控与合规;审计;银行系统监控平台;事后监督系统;客户细分和画像;潜在客户挖掘;客户迁徙和流失预警;交叉销售;舆情分析。。。...
互联网服务资源评估·2016-09-21
朱祥磊 · 某移动公司 擅长领域:人工智能, 云计算, 大数据
98 会员关注
嗯,目前并无标准和共识,只能根据实际业务量、负载程度、并发量等指标做具体分析,建议在测试阶段即获取应用负载一手数据,然后据此在生产上进行综合评估。

描述

Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不...(more)
Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越,换句话说,Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。
X社区推广
  • 提问题