大数据的数据源很广泛,它们可能来自于三个主要方面:现有公司内部网各应用系统产生的数据(比如办公、经营生产数据),也有来自公司外互联网的数据(比如社交网络数据)和物联网等。各应用系统产生的数据也都有不同的数据生命周期,来自互联网的社交数据也有自己的数据生命周期,那么不同的数据源汇总进来,如何设定策略去管理其生命周期,使数据在生命周期内能发挥自身的价值?
现在在一套存储系统中,我们往往会提存储的虚拟化,存储的异构,但是像您提到的这样,其实数据源也是异构,区别很大。有结构化,非结构化,流式数据,多媒体文件等等。如何更有效的管理这些数据对公司的it管理员来说是很大的挑战。
具体选择什么样的我策略这个跟业务类型有关,从存储产品的角度来看,我觉得从文件系统层面解决这个问题会更容易,因为文件系统是离业务最近的存储系统组件,可以定义灵活的策略与上层业务系统结合。
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30