分布式存储对运维管理的挑战?

分布式存储具有可扩展能力强,价格优惠等特性,但在稳定性、高可用性、运维管理等方面与传统集中式存储差异较大,分布式存储软件版本迭代更新及与底层通用x86服务器硬件兼容性等是较大运维难点,对于长期使用集中式存储的用户来说,应该从哪些方面进行准备,以便于将来安全高效推广分布式存储?

参与12

5同行回答

匿名用户匿名用户
如果说对于运维的挑战,不如说对业务的挑战,简单总结,其实就三点:多场景,高可靠,高性能。下面进行展开。可靠性、性能、扩展性满足要求,关键在于节点扩容能够保证保证性能和容量随节点增加而线性增长,同时需要保证IO的读写性能,其中需要考虑一个问题,IO的读写对于集中式存储而言,是非...显示全部

如果说对于运维的挑战,不如说对业务的挑战,简单总结,其实就三点:多场景,高可靠,高性能。下面进行展开。
可靠性、性能、扩展性满足要求,关键在于节点扩容能够保证保证性能和容量随节点增加而线性增长,同时需要保证IO的读写性能,其中需要考虑一个问题,IO的读写对于集中式存储而言,是非常简单的,只需要写入一个磁盘阵列中就算可以,在分布式存储中,需要写入若干个节点才判定成功,如果出现问题,排查也是一件比较困难的事,其中涉及了分布式存储的集群架构。
其二,场景化能力,主要涵盖了容器、云、虚拟化的复杂场景,还包括了数据库的场景。需要满足双活和异地容灾的能力,需要通过灵活的配置,满足不同业务的存储需求,能够有效降低各类存储系统的投资和管理成本。
其三,管理方面的挑战,主要在监控和迁移,对于监控而言,当大量的节点存在,监控的范围也线性增加,出现问题的时候,需要判断节点和节点之间的作用。对于迁移而言,海量小文件或数据导致分批迁移的难点增大。

收起
银行 · 2021-12-15
浏览1503
radiumguoradiumguoITS英特尔(中国)有限公司
无论是软硬分离采购的模式,还是使用SDS分布式存储一体机,存储管理员对服务器硬件的理解和管理能力都是很重要的,我们所见的过相当一部分问题来自于系统设计或使用者不了解服务器类产品的特点,规格和管理方式。SDS分布式存储毕竟是一个构建在标准服务器上的开放系统,会有更多传...显示全部

无论是软硬分离采购的模式,还是使用SDS分布式存储一体机,存储管理员对服务器硬件的理解和管理能力都是很重要的,我们所见的过相当一部分问题来自于系统设计或使用者不了解服务器类产品的特点,规格和管理方式。SDS分布式存储毕竟是一个构建在标准服务器上的开放系统,会有更多传统存储管理上涉及不到的问题。

收起
硬件生产 · 2021-12-21
浏览1497
李静12138李静12138产品解决方案总监星辰天合(北京)数据科技有限公司
      分布式存储,从近些年客户实际使用看,其稳定性、可靠性表现并不弱于传统集中式存储,其基于多副本/EC等方式的数据冗余策略,可以灵活实现盘级、节点级、机柜级的可靠性保障,结合双活、远程复制等特性,可以实现跨机房跨地域的容灾保护;基于存储集群系统提供的亚健康检...显示全部

      分布式存储,从近些年客户实际使用看,其稳定性、可靠性表现并不弱于传统集中式存储,其基于多副本/EC等方式的数据冗余策略,可以灵活实现盘级、节点级、机柜级的可靠性保障,结合双活、远程复制等特性,可以实现跨机房跨地域的容灾保护;基于存储集群系统提供的亚健康检测机制,可以针对硬盘、存储网络等提前识别潜在的故障点(如慢盘),提前隔离,确保整个集群的可靠性,包括华为、XSKY等厂家均具备这样的能力;
       对于存储系统的运维管理,分布式存储系统也有自身很多高价值的优势,包括多集群的统一集中管理、可视化的展示、在线的扩容,业务自动均衡等,对于SDS软件定义的分布式存储,诸如XSKY的产品,可以提供软硬解耦和软硬一体的方案灵活选择,通过完善的硬件厂商生态合作,支持广泛的硬件平台混合部署,支持跨平台的数据在线流动,可以有效解决传统集中式存储维保到期面临的数据迁移头痛问题,同时也为金融客户在做国产化试点中可实现intel X86和国产硬件平台共存、平缓演进的需求。
       客户选择分布式存储,更多需要依赖自身考虑的应用场景对存储系统的要求,包括综合衡量性能(iops/时延/吞吐)、数据量/扩展能力、可靠性、成本等因素,此外还需要结合存储服务的类型选择块、文件、对象存储。
       分布式存储软件的版本迭代要求业务无感知的情况下可以升级,这也是业务在选型分布式存储很重要的考量点,针对硬件的兼容适配以及服务故障情况下的问题解决,规避方案可以考虑采购一体机,另外如果必须软硬件分离,严选分布式软件兼容性列表的部件,可以很好的规避很多问题;

收起
软件开发 · 2021-12-21
浏览1435
light_hu86light_hu86系统工程师某省金融
1、面对分布式存储设备数量规模逐渐增长,面对数量庞大的集群,设备故障的概率也在增大,面对几乎每日都有出现的设备故障,对运维来说也是一个挑战,几乎每日都要处理相关的设备故障;2、容量管理,对于整体存储而言,容量管理对运维来说是事先要规划好的的容量横线,当超过横线后通过扩容...显示全部

1、面对分布式存储设备数量规模逐渐增长,面对数量庞大的集群,设备故障的概率也在增大,面对几乎每日都有出现的设备故障,对运维来说也是一个挑战,几乎每日都要处理相关的设备故障;
2、容量管理,对于整体存储而言,容量管理对运维来说是事先要规划好的的容量横线,当超过横线后通过扩容或删除数据等方式确保容量的饱和度;
3、监控,分布式存储告警与行内统一监控系统对接,底层设备监控做到监控全覆盖,实现告警及时推送,及时告知,及时处理;
4、备份,对于分布式存储重要数据,特别是平台侧数据或重要业务的数据,备份也是需要的,通过跨中心灾备的形式确保数据的跨中心同步复制。

收起
银行 · 2021-12-20
浏览1500
匿名用户匿名用户
尽量选软硬件自产自销的产品,如华为,兼容性,可维护性都有保障,也不会软硬扯皮。分布式无非就是外形变了,里子还是一样,总线变网线而已。显示全部

尽量选软硬件自产自销的产品,如华为,兼容性,可维护性都有保障,也不会软硬扯皮。分布式无非就是外形变了,里子还是一样,总线变网线而已。

收起
系统集成 · 2021-12-15
浏览1551

提问者

chenmingfu
基础架构组长西部某城商银行
擅长领域: 存储灾备服务器

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2021-12-15
  • 关注会员:6 人
  • 问题浏览:3007
  • 最近回答:2021-12-21
  • X社区推广