基础运维工作内容包括哪些?
1、服务监控技术:包括监控平台的研发、应用,服务监控准确性、实时性、全面性的保障;
2、服务故障管理:包括服务的故障预案设计,预案的自动化执行,故障的总结并反馈到产品/系统的设计层面进行优化以提高产品的稳定性;
3、服务容量管理:测量服务的容量,规划服务的机房建设,扩容、迁移等工作;
4、服务性能优化:从各个方向,包括网络优化、操作系统优化、应用优化、客户端优化等,提高服务的性能和响应速度,改善用户体验;
5、服务全局流量调度:接入服务的流量,根据容量和服务状态在各个机房间分配流量;6、服务安全保障:包括服务的访问安全、防攻击、权限控制等;7、服务自动发布部署:部署平台/工具的研发,及平台/工具的使用,做到安全、高效的发布服务;
8、服务集群管理:包括服务的服务器管理、大规模集群管理等;
9、服务成本优化:尽可能降低服务运行使用的资源,降低服务运行成本;
10、数据库管理(DBA):通过设计、开发和管理高性能数据库集群,使数据库服务更稳定、更高效、更易于管理。
11、平台化的开发:类docker等平台的开发管理,及服务接入技术等等。
当然随着时代的变化,云计算时代的大背景下,很多公司基础运维工作也发生了一些变化:
1、快速创建和复制云主机资源模板,为不同业务团队配置性能合适的主机模板,以及主机资源申请、创建、交付、运维以及最终的释放销毁的全生命周期管理;
2、还有应用程序和支持软件的安装部署/交付和升级,集群性能负载均衡调配、服务器的批量脚本操作、数据库维护、主机的监控、运维日常工作的审计等等;
3、多云情况下,各云使用的费用情况也需要统计和分析等等。
基础运维所需学习基础知识
1、微软系统
2、Linux/BSD系统
3、编程开发
4、网络配备
5、存储
6、操作系统以及应用程序层面上的技能
给力的基础运维工作方式-使用云管平台
作为业界领先的多云管理平台,行云管家是国内唯一一家以SaaS形态提供的云计算管理平台,为您提供以下7大核心功能:
1、支持业界主流公有云厂商,以及OpenStack、VMware等私有云设施;
2、提供基于工单流程的云资源申请、创建、交付、运维、销毁全生命周期管理;
3、从系统安全、网络安全、性能负载、趋势预测4个维度实现主机的监控与体检;
4、内置堡垒机模块,承担起用户在管理IT资产的运维中枢、会诊平台和“事前授权、事中监管、事后审计”的黑匣子等职责,全面保障企业IT资产的安全运维、合规审计;
5、分析读取公有云账单,从各个维度分析云主机的各项成本支出,通过对应用负载的数据挖掘,告诉您如何进行云资源的增减配;
6、自动化运维,提供脚本/命令批量执行、预设脚本库、文件自动分发/收集、任务编排等自动化运维特性;
7、支持SaaS形态和私有化部署形态,只需注册开箱即用。