分布式存储项目建设中的技术疑难,ssd和hdd缓存加速算法哪家好?

如何判断ssd和hdd缓存加速算法哪家好,配比如何控制。内存配置ceph建议是1t硬盘1g上8-10t大硬盘有何需特殊考虑各家块文件对象实现和建设付费方式对比,磁盘划分按t付费,还是整机付费,都需要单独建设。...显示全部

如何判断ssd和hdd缓存加速算法哪家好,配比如何控制。
内存配置ceph建议是1t硬盘1g上8-10t大硬盘有何需特殊考虑
各家块文件对象实现和建设付费方式对比,磁盘划分按t付费,还是整机付费,都需要单独建设。

收起
参与11

查看其它 1 个回答匿名用户的回答

匿名用户匿名用户

面向 SSD-HDD 混合存储提出了一种基于动态替换代价的缓存调度算法(DRC),以请求中的热点数据以及替换数据的代价作为缓存替换依据,不仅有效地提高了缓存命中率,而且,通过减少磁盘随机写操作提升了系统的整体性能。

云计算系统的存储设备被多个虚拟机共享,导致数据读写的特征是随机化和碎片化的。

DRC:算法综合考虑了访问次数、访问频率、数据块是否“脏”等特性,计算出数据块的替换代价,并基于替换代价来调度缓存,从而提高了数据读写的命中率,进而提升了混合存储系统的性能。

此混合存储系统基于Linux的Device Mapper 架构来实现。

考虑到数据的热点迁移与访问频率的变化,DRC以在缓存中的数据页面的替换代价作为主要的排序标准,不但考虑热点的迁移,而且新增热点数据能够更好的响应。

一个缓存集合有两个队列,偶尔访问队列和频繁访问队列。当页面调入缓存,先放在偶尔访问队列,按LRU排序,偶尔访问队列的数据被访问后访问次数+1,达到访问阈值后迁移到频繁访问队列并清零访问次数。由于热点数据会随着时间迁移,所以每隔时间 T_half,将两个队列中的数据块被访问次数左移一位,避免在过去时间内某个数据块的访问次数积累较多造成新的热点数据被替换。

计算替换代价时,如果这个数据是脏,替换代价为DCOST*REFCOUNT,否则代价就是REFCOUNT,计算后将缓存内的数据按替换代价排序。

银行 · 2019-05-31
浏览2694

回答状态

  • 发布时间:2019-05-31
  • 关注会员:3 人
  • 回答浏览:2694
  • X社区推广