个人比较推荐kettle,主要kettle也支持集群。另外hadoop平台的mapreduce也可以作为ETL工具使用。
目前来说开源比较好的基于大数据完整的应用主要是pentaho,其ETL,报表,分析工具等都有相关方案,至于商用的收费软件就更多了,不过我们自己本身也会基于独特的应用场景做自身的内容。...
首先 你的问题是一个系统架构的问题因为你的数据没有经过处理 fm在面对大量数据的时候确实比较难(更具你的硬件配置会有不同)BI是一个面向主题的系统 ,你需要控制你们的需求,分成若干主题 每个主题设计若干fact表,这个就类似于你用存储过程生成的summary table ,你的fm使用的...