大数据生命周期如何定义,哪些技术会在这个周期内有实际意义

大数据本身的意义在于有效数据的合理利用,在有效数据的基础上,建立数据模型,形成分析基础,产生对业务有意义的分析结果。所以从技术考虑,我们如何规划大数据的生命周期,所谓的自动化是如何处理好中间数据及过期数据?有哪些技术可以在整个生命周期内有意义?希望大家可以给予指导。...显示全部

大数据本身的意义在于有效数据的合理利用,在有效数据的基础上,建立数据模型,形成分析基础,产生对业务有意义的分析结果。所以从技术考虑,我们如何规划大数据的生命周期,所谓的自动化是如何处理好中间数据及过期数据?有哪些技术可以在整个生命周期内有意义?希望大家可以给予指导。

收起
参与4

查看其它 1 个回答liyafei的回答

liyafeiliyafei软件开发工程师IBM

我的理解其实大数据的生命周期归根结底就是根据数据的价值的变化,将数据在不同的存储池之间迁移,包括高性能存储池,低速磁盘存储池和备份存储池等。所谓的自动化就是在文件系统或者类似的数据管理平台上将数据在不同的存储池之间迁移。这个功能在文件系统上实现的好处是在上层可以保持一个单一的命名空间。可以参考各家存储厂商的实现,我们IBM的Spectrum Scale里的ILM是一个典型的实现。

硬件生产 · 2015-12-08
浏览2069

回答者

liyafei
软件开发工程师IBM
擅长领域: 存储闪存

liyafei 最近回答过的问题

回答状态

  • 发布时间:2015-12-08
  • 关注会员:2 人
  • 回答浏览:2069
  • X社区推广