首先要明确到底要解决什么问题,要搞清楚为了什么整合,整合的维度,个人经验还是从系统的重要程度出发,按照应用是管理类型(olap)还是在线业务(oltp)进行 区分组合。对于分析型的系统通常是体量大重io的库相对oltp 连续性的要求较低,而平时的资源利用率又较低的系统,适合整合到一起...
徐攀登 · 中国电信江西公司
1 会员关注
这块还是要用分布式存储来解决数据容量大、数据种类多的问题。实时数据采集可以使用flume或kafka来解决,不过对服务器网卡要求和内存较高。实时处理使用spark stream或者storm来实现。
如果数据量不大或者备份时间能接受的情况下就每天全备,这样恢复起来比较简单