微博数据有图片跟文字,想做对图片和文字的处理,在此基础上做模式识别。现在对于数据存储的方案很难抉择, 考虑高可扩展性,高读写。因为数据的多样性: 图片和文本。有没有人给些设计的建议?用不同的存储技术或者用NoSQL (,MySQL, MongoDB, Hadoop, 还是Spark)的一种。谢谢!...
显示全部微博数据有图片跟文字,想做对图片和文字的处理,在此基础上做模式识别。
现在对于数据存储的方案很难抉择, 考虑高可扩展性,高读写。
因为数据的多样性: 图片和文本。有没有人给些设计的建议?用不同的存储技术或者用NoSQL (,MySQL, MongoDB, Hadoop, 还是Spark)的一种。谢谢!
收起