互联网服务自动化运维

自动化运维的痛与乐?

由于没有什么具体使用经验,这里只做对自动化的浅显理解和疑问,各位看官轻拍。自动化在云概念提出前就早已出现,部署自动化、批量更新等,几乎所有的工作在某个角度来看都是可以自动化的,而且优势明显:规避人为风险、保证批量一直、省时省力。但是,作为真正面对一线环境,需要实际上...显示全部

由于没有什么具体使用经验,这里只做对自动化的浅显理解和疑问,各位看官轻拍。

自动化在云概念提出前就早已出现,部署自动化、批量更新等,几乎所有的工作在某个角度来看都是可以自动化的,而且优势明显:规避人为风险、保证批量一直、省时省力。但是,作为真正面对一线环境,需要实际上手操作的工程师的我们,是不是真的可以依赖自动化呢?成百上千套生产环境,仅仅因为审计需要加个用户,赋个权限,如果人工执行,估计手指要断了;新增应用部署5套系统,需要2人天的工时,可能领导就不高兴了。以上两种情况仅仅是自动化提供的批量一致性工作,如果有自动化,至少可以节省大量的人力成本。我也是这么想的,而实际情况如何?举个毛栗:当我知道需要在20+套服务器上创建同一个用户时,我内心是拒绝的,这要登录多少遍,即使复制粘贴也要开20+个终端,太傻了!我想到了啥?没错,ansible,对于其他批量执行的工具,这个太省事了,部署,配置,测试执行(如果问我我肯定说是测试环境),但是我发现个问题,这20+个客户端的python版本不一致,有些版本过低,还好,解决起来还算容易,遇到些问题也算正常。但是我发现了一个让我郁闷了很久的问题,就是ansible在通过ssh访问客户端时,配置文件里可以写明密码?WTF?这也行(实践证明,确实好多人这么干了)?这不是表示只要攻破了ansible服务器,就拿到了密码本。不管这么多,先把工作完成了,就开始研究明文密码的问题,经过多个方式测试,总结出(偷懒得出),不写明文密码,加参数,交互输入,这个我个人还是比较喜欢的。可能有人要问,为啥不用剧本?剧本?我就加个用户,我还要写个剧本?这又引出来一个问题:有没有必要程式化一个操作?什么样的动作需要程式化?有多少这样的动作?就目前我遇到的情况(孤陋寡闻),我没写过剧本,除了因为我比较懒,主要是因为没有什么事这次干完,下次还要。。。

上面把自动化仅仅理解成批量化了,但是确实用的也是最多的,在使用自动化时,还有一个特别特别重要的问题,就是实施环境中,是不是按照一定的规范和相同的结构,比如私有云环境和传统架构,linux的各个大版本(尤其是7和之前的版本),在这些问题面前,如何自动化?抛砖引玉:是不是可以做到简单问题的监控+自动化处理?一些定时执行的动作批量处理+集中收集分析出报告?

收起
参与3

返回cnboom的回答

cnboomcnboom系统工程师Groupama-Avic

感谢 分享~~~

保险 · 2019-11-29
浏览1262

回答者

cnboom
系统工程师Groupama-Avic
擅长领域: 服务器灾备存储

cnboom 最近回答过的问题

回答状态

  • 发布时间:2019-11-29
  • 关注会员:2 人
  • 回答浏览:1262
  • X社区推广