IT咨询服务GPFSGPFS集群

GPFS的集群拆分?

我和一个客户讨论他们网络升级时,他们顺便想我咨询了一个VDI存储架构升级方案,他们现有供应商认为他们的这个想法无法实现。我发现咱们群里有很多GPFS行家,因此想冒昧咨询一下,下面的想法能否实现?如果可以有没有参考或建议。我对存储技术一知半解,如果描述不清楚,还望海涵:-)

1、背景
客户企业现有一套VDI系统,存储采用GPFS软件+DDN硬件存储。其中7个GPFS节点,2套DDN存储。按照客户讲法,2套存储模式为双活(不是异步复制)。现状如下图。
2、目标
实际2年维护下来发现若干问题(暂不展开),现在希望将其分拆为2套,之间采用异步复制。客户希望拆分过程尽量短,即保留原有NSD,不要采用耗时的备份还原。未来如下图。

参与21

5同行回答

cpc1989cpc1989课题专家组存储工程师某保险公司
方案可行,之前做过类似的双集群的方案,不同之处是底层存储采用的是双活。 有一点提醒,GPFS的NSD里是保存了文件系统的磁盘map信息的,特别是主站点磁盘扩容等场景,两个集群需要做好配置信息的同步,否则副节点集群文件系统是无法拉起的。...显示全部

方案可行,之前做过类似的双集群的方案,不同之处是底层存储采用的是双活。 有一点提醒,GPFS的NSD里是保存了文件系统的磁盘map信息的,特别是主站点磁盘扩容等场景,两个集群需要做好配置信息的同步,否则副节点集群文件系统是无法拉起的。

收起
保险 · 2021-01-04
charleschencharleschenIT顾问IBM
如果非必要不要采用AFM DR方式,这个方案bug非常多,处置麻烦显示全部

如果非必要不要采用AFM DR方式,这个方案bug非常多,处置麻烦

收起
互联网服务 · 2021-01-08
浏览1229
  • 非常感谢!那请问:1、GPFS安装集群补丁时,是否真的需要集群所有节点离线安装?2、如果真的需要,有没有其他方法保障业务继续?IBM对此有推荐方案吗?
    2021-01-08
sllutsllut系统工程师IPS
提前备份好数据,找停机窗口把要分为GPFS02的节点上的NSD数据迁移到GPFS01上,再剔除这三个nsd server去新建集群。两个集群做AFM异步同步即可。显示全部

提前备份好数据,找停机窗口把要分为GPFS02的节点上的NSD数据迁移到GPFS01上,再剔除这三个nsd server去新建集群。两个集群做AFM异步同步即可。

收起
硬件生产 · 2021-01-06
浏览1568
  • 据供应商说,AFM DR的要求很高,GPFS内置关闭了此功能,需要IBM现场勘察后开启,因此他们不建议使用AFM DR。对此有何意见?
    2021-01-08
  • 用户允许异步复制了,表明能容忍一定的RPO。不要用DR,直接用AFM就行,这个是可以开启的。
    2021-01-28
jiaxu2000jiaxu2000系统工程师沈阳医学院附属中心医院
1.不知道你clinet的情况,通过什么协议访问的gpfs节点,拆分之后将如何访问01集群和02集群?2.不知道01和02集群之间链路的情况3.不知道7个节点都是什么节点,都是server节点?DDN上的LUN是如何分配给集群的拆分的时候,如果集群1保持正常工作,能不影响clinet的业务,集群2就可以慢慢弄...显示全部

1.不知道你clinet的情况,通过什么协议访问的gpfs节点,拆分之后将如何访问01集群和02集群?
2.不知道01和02集群之间链路的情况
3.不知道7个节点都是什么节点,都是server节点?DDN上的LUN是如何分配给集群的

拆分的时候,如果集群1保持正常工作,能不影响clinet的业务,集群2就可以慢慢弄了

收起
事业单位 · 2021-01-05
浏览1487
  • 1、7个节点都是Server节点,前端是NFS Client,将GPFS作为NFS服务器 2、01、02之间通过100Gbps以太网 据用户说,拆分的原因是GPFS最近发布一个集群补丁,需要整个集群离线安装,他们担心以后还有此类问题,因此想分成2个集群,之间进行复制,如有此类问题,可以安排计划内停机,逐个集群打补丁。
    2021-01-08
  • 什么样的补丁会要求整个集群离线安装升级补丁呢?当前什么版本?
    2021-01-08
  • GPFS的补丁我知道的有两种,一种是公开发行大版本补丁,比如从5.1.0.0升级到5.1.0.1,另一种是内部使用的小版本修正补丁,比如从5.1.0.1升级到5.1.0.1.xx。打补丁是否要停集群得看补丁的说明,一般版本跨度不大的大版本补丁都支持在线升级,比如最新的5.1.0.1说明写到 Update to Version: 5.1.0.1 Update from Version: 4.2.0.0 - 5.1.0.0 (If upgrading node by node ) 3.5.0 - 5.1.0.0 (If you shutdown and upgrade the entire cluster) 是支持从4.2之后在线升级的,个别内部使用的小版本修正补丁不排除有特殊的要求。 NFS Client不明白为什么要用7台服务器,使用的是CNFS还是CES NFS?上述两种情况应该只有一个Server节点可以对外提供NFS服务,也许是轮到该节点打补丁的时候,造成了集群NFS服务的中断。如果是CES NFS可以先把NFS服务切换到其他节点,再打补丁,切换的过程会有秒级的中断,CNFS是分钟级的中断。GPFS最新的5.1版本据说支持NFS 4.1协议了,但是否支持PNFS我还没找到相应的文档
    2021-01-10
沈天真沈天真售前支持IPS
如果要求现网升级,且升级过程中业务不中断,需要考虑的就很多了,可能行不通的;显示全部

如果要求现网升级,且升级过程中业务不中断,需要考虑的就很多了,可能行不通的;

收起
硬件生产 · 2021-01-04
浏览1394
  • 如果用户接受停机的时间损失,这样可以行吗?
    2021-01-05
  • 其实是一个集群变2个集群了,每个节点上运行的组件都不一样了,而且集群的信息也都改变了。最简单如集群管理节点,现有集群里面管理有7个节点的信息,还有磁盘映射信息等等。变成2个集群后,新的集群里面就需要有新的集群管理节点,等等。等于是重建啊;只能新建一个集群作为过渡,再拆现有的。
    2021-01-05
  • 今天和用户交流项目的起因,发现一个很奇葩的问题。咨询一下是否确有此事 1、服务商告知GPFS有错误报警,IBM在2020.12 发布了一个群集补丁。 2、安装该补丁,必须群集离线。结果服务中断 3、用户害怕了,因此想分开来做AFM RD
    2021-01-07

提问者

raphlgu
项目经理旭升
擅长领域: 安全灾备存储

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2021-01-03
  • 关注会员:6 人
  • 问题浏览:3822
  • 最近回答:2021-01-08
  • X社区推广