系统集成NFS 网络文件系统对象存储 Ceph 非结构化数据存储文件存储

Ceph对文件查找的加速问题？

目前用的文件存储是nfs。一个文件夹里面有千万级的pdf文件,检索某一个文件大概耗时2-5秒,如果在不改变查找算法的前提下使用ceph，能否加快文件的检索速度呢？

参与7

1同行回答
全部行业
全部行业 互联网服务
|
按赞同排序
按时间排序

Lucien168存储工程师地平线机器人

1.背景说明
用户需要从一个文件从检索出一行数据，并且对延迟和性能要求比较高。

1.1 现在做法
普通的做法是A用户上传2G的文件到Ceph集群， B用户拉取该2G的文件到本地，然后根据offset检索这行数据。

这其中的做法是用户检索量比较大的时候，都需要拉取不同文件的2G数据，延迟比较高，严重影响用户的体验。

缺点：

用户端检索延迟大，影响用户体验
客户端端集群网卡带宽有限
量大对Ceph集群负载影响严重
1.2 优化方案
能不能只拉取我需要的信息，不用全量拉取到本地，答案是肯定的。

思路：

根据文件信息查找所有的object信息
根据offset找到需要检索的object信息
找到对应的object 检索一行的数据（一行数据可能会拆分多个object)
优点：

提升用户体验
客户端网络网卡带宽可用率得到提升
减少对ceph集群的冲击影响

方案详见： https://www.jianshu.com/p/4d8576173f84

互联网服务 · 2018-10-30

浏览1781

查看赞同的人

提问者

系统工程师新云东方

擅长领域：存储，灾备，软件定义存储

评论71

问题来自

活动 - 某大型金融集团对象存储需求分析和架构设计线上答疑

相关问题

Kafka容器持久化方案对比？

目前容器云存储除了NAS和对象存储常见场景外，SAN存储在银行使用情况？

非结构化数据的存储及解决思路？

三甲医院PACS影像存储如何分层选型？

如果后续产品和架构改造升级，长期保存的数据如何处理？

相关资料

大数据湖体系规划与建设方案

006 对象存储应用场景及特性介绍

存储系统基础知识介绍

保险行业数据长期保存解决方案

银行基于Dell EMC ECS对象存储架构的应用实践手册

相关文章

城商行10亿级以上影像数据平台基于分布式对象存储方案架构设计及实践

保险双录/影像系统非结构化数据存储项目对象存储产品选型课题研究总结

主流分布式存储技术对比分析

基于华为NAS存储在某车企业务系统上的应用实践

信创云环境下，如何部署对象存储和NAS存储实践

问题状态

发布时间：2018-10-29

关注会员：2 人

问题浏览：2508

最近回答：2018-10-30

关于TWT 使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们
© 2024talkwithtrend — talk with trend,talk with technologist 京ICP备09031017号-30

X社区推广