超融合平台项目上线后,如何对运维工作进行管理安排?

超融合项目上线以后,对运维部门应该如何运维好,从哪些方面进行运维管理安排?显示全部

超融合项目上线以后,对运维部门应该如何运维好,从哪些方面进行运维管理安排?

收起
参与18

查看其它 3 个回答wykkx的回答

wykkxwykkx  系统架构师 , 某基金公司

企业超融合平台上线后,笔者认为需要从以下几个层面做好运维工作。
一是甲方需要指定运维负责人,这个负责人可以是专岗也可以是兼任的岗位,总之要能够有人对平台运维负责;
二是运维负责人需要对平台的整体情况有个清晰的认识和掌握,硬件层面需要知道平台的物理部署情况(机房、机柜、U位、连线情况、物理机的配置情况等),软件层面需要知道平台如何使用,常用的功能有哪些;
三是需要熟练的掌握超融合平台的各项指标信息的具体含义,平台自检的入口在哪里,哪些指标是需要重点关注的,现在很多超融合平台都是有很多指标可以反映出平台的健康状态、容量状态等信息,以便为问题处理和后续建设提供依据;
四是超融合平台一般都会有告警模块,可以将平台的报警信息记录下来,但是一般而言现在大多数公司都有自己的监控报警平台,这里从运维一体化和简易的角度考虑,应该要求超融合平台将自己的报警信息吐到公司已有的监控平台上,统一进行报警管理;
五是运维人员应该经过服务商培训之后能够做到对平台的最合理使用,尽可能避免人工的误操作以及低效操作的发生;
六是定期巡检,甲方的运维负责人应该定期的对平台进行巡检,这里的巡检主要包括物理资源情况巡检、平台端提供的巡检能力的巡检,以及操作体感(例如突然觉得操作很慢,卡顿明显、显示数据有问题等)方面的巡检;还应该要求服务商定情对平台进行更全面的巡检;七是版本升级,一般而言新的版本都会有功能或者非功能性的提升,建议在厂商发布新版后的2-3个月后再进行版本升级。以上七点就是笔者认为运维超融合平台需要做到的事项。

基金 · 2019-05-08
浏览4321

回答者

wykkx
wykkx0412
系统架构师某基金公司
擅长领域: 云计算容器系统运维

wykkx 最近回答过的问题

回答状态

  • 发布时间:2019-05-08
  • 关注会员:5 人
  • 回答浏览:4321
  • X社区推广