查看其它 8 个回答myskytree的回答

myskytreemyskytree  运维管理领域架构师 , IT运维管理专家

题主的标题隐含企业错综复杂的运维管理现状,非常值得揣摩。主要从工具和人两个方面入手(项目预算投入以最低化去评估),先枚举如下几种情况:

情况一:企业已有运维监控工具使用商业软件,运维人员技术不强,主要靠外部资源完成项目落地。
此类情况建议第一步:云管平台软件自身监控使用云管软件自带的监控(通常云管商业软件自带监控告警功能)。不要轻易的去做云管软件和现有监控系统的集成,此部分属于定制开发,甲方自身没有能力,需要受制于外部资源,投资回报率低。结论:云管平台不进行监控。
第二步:云管软件内部创建的资源【虚机、虚拟机内部的中间件、内部的数据库】建议使用原有的商业软件,因为可以复用已有的监控系统,没有新技术引入学习成本,落地没有风险。

情况二:企业已有运维监控工具使用商业软件,运维人员技术强,逐步由商业运维监控软件过度到开源&自研。
此类情况建议第一步:通过简单的二次开发,实现现有的云管平台本身的告警和现有商业软件的对接。
第二步:云管软件内部创建的资源【虚机、虚拟机内部的中间件、内部的数据库】建议作为一个创新示范点,所有的OS以上的监控使用开源软件(譬如:Zabbix,Prometheus, InfluxDB, EFK, SkyWalking, Grafana等)建立全新的运维管理体系。
第三步:已有的商业运维管理软件在第二步的积累下,逐步过渡到开源运维领域。

情况三:企业已有运维工具使用开源软件,运维人员或者技术服务商技术能力强。
此类情况第一步:云管软件内部创建的资源【虚机、虚拟机内部的中间件、内部的数据库】建议使用现有的开源监控软件
第二步:云管本身的告警和开源软件对接
第三步:云管API和开源软件全方位对接

其它情况不一一枚举,如上所述,企业不论是监控工具、还是自动化工具,还是其它任何的IT建设,都需要考虑现状、技术可行性、投入成本、项目优先级、人员能力等众多因数,不同的企业应当因地制宜的采用不同的建设落地方案。

IT咨询服务 · 2020-03-19
浏览1855

回答者

myskytree
运维管理领域架构师IT运维管理专家

myskytree 最近回答过的问题

回答状态

  • 发布时间:2020-03-19
  • 关注会员:10 人
  • 回答浏览:1855
  • X社区推广