现在电信行业在针对大数据的处理,我们现在准备用Spark技术,还在了解,希望借这个机会来学习交流下:
1、Spark 技术最适用于哪些应用场景?
2、在应用Spark 技术时,需要做哪些改变吗?
3、企业如果想快速应用Spark 应该如何去做?
目前来说互联网公司使用Spark,其本质是为了解决一些Hadoop生态圈中其他组件的一些痛点,比如:spark streaming 对应的Storm
Spark MLLib 对应的 mahout
Spark Core 对应的MR
Spark SQL 对应的Hive
各种应用场景中都有Spark的身影。
主要看对应业务线的需求和现状而定。