现有小文件,数量几亿甚至上百亿,目录深度较深,数据量大概是100TB。不知道采用哪种存储架构存储比较合适,还得要考虑备份。
不能光考虑如何存,还要考虑存完之后,如何用,例如如何检索我知道一家国产公司的产品,做这方面还可以。私聊吧
目录层数深:是 posix 文件系统的缺陷结构百亿小文件,通常需要CMS+Object对象存储架构
对象存储不在意 一个层级放多少,可以基本无限扩展考虑到怎么使用,可以自己定义一套数据库来做元数据,也可以使用内存管理模块给应用层提供API
之前给某万亿大行做了 一套,现在应该数PB 小文件了
这样的规模和数据,肯定需要分布式存储结构。
目前太深会导致查找的性能不好,是不建议的,建议在三级以内。
在存储介质方面,100T空间容易存储,使用磁盘就可以了,如果对性能有要求就可以通过cache机制,基于SSD或内存来提高性能。
备份方面,使用同样的存储架构,根据容灾要求,存储两个和三个副本,同时考虑异地的情况。
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30