这些都是一些非结构化数据,对这些资料的使用取决于实际业务场景。一种可行的方案是“mysql+hadoop”。在描述一个文件的时候,可以将其分为2部分,一部分是元数据的描述,比如业务交易号、流水号,文件在 hadoop 中的存储位置等,一部分是真正的文件,将其存储在 hadoop 中。
1)扩展性:hadoop 的架构可以实现横向扩展,相对比较容易。
2)数据管理:所在的业务数据都有一定的生命周期,可以将数据分为hot data,warm data, cold data。等业务超出生命周期后,进行数据归档和清理。从而保证系统数据不会被无限扩大。这些都是非常成熟的案例。