岗位职责:
对公司的IT系统(交易系统,门店系统,企业系统等)提供高效的运维工作、确保稳定运行,能做到7×24快速响应
提供高质量的运维工具,理念,新技术,帮助整个IT团队提升工作效率
负责对目前系统的稳定性优化,系统性的解决程序问题性问题,提供业界最佳实践并能实际有效的在工作中落地。提供疑难问题的分析和有效解决方案,优化系统架构,有效降低成本。
工作内容:
1.业务系统管理,确保系统工作正常运行及故障时的及时响应(20%)
- 通过开发或推进自动化运维工具来降低手工操作的维护成本
- 团队成员合作、沟通,建立知识库,不断分享知识
2.负责线上系统的可靠性改进(50%)
- 主导SOP制定,监控改进,容量管理,变更管理,应急响应,故障演练,等改进工作
- 研究熟悉业务系统架构,实现性能优化,提高系统的健壮性
- 通过持续的全方位数据运营(包括可用性指标、历史事故、资源利用率等),找到系统薄弱点,落地地改进项目
- 提供运维最佳实践,为业务架构设计与组件选型提供指导,输出运维技术文档
- 建立容量管理,具备优化系统架构,提升性能,降低成本
3.故障处置及事件管理(10%)
- 熟练运用主机监控、日志分析、APM等工具进行复杂问题定位及服务稳定性问题追查,为一线工程师提供及时专业高效的技术支持
4.项目管理(10%)
5.供应商管理(10%)
- 负责目前合作厂商的日常管理,驻场人员管理以及其他相关工作
岗位要求:
- 计算机科学与技术或相关专业本科以上学历
- 五年以上工作经验,熟练掌握2种以上脚本语言(Shell、Perl、Python、Go等);
- 深入理解Linux操作系统、体系结构。了解Linux环境下的进线程、内存管理、IO体系等操作系统工作原理;
- 对操作系统、数据库、容器技术、虚拟化技术、TCP/IP协议、分布式计算框架的一个或多个等有较深入的理解;
- 优秀的的开发能力,熟悉常用的自动化运维工具;
- 熟悉常用的持续集成工具;
- 熟悉常用的监控工具(例如Open Falcon、Prometheus、Zabbix等);
- 熟悉常用中间件(例如:MQ、Redis、Kafka、Nginx等);
- 熟悉容器技术,能够设计基于容器和微服务的持续交付流水线;
- 有大数据和AI系统运维经验优先
- 有完整自动化运维工具开发经验与运维体系建设经验优先
- 有大型平台开发经验者优先,(CMDB建设、配置变更、智能监控、移动App开发等);
- 性格开朗,较强的学习和沟通能力,有高度的责任心和使命感。工作细致、善于思考,有很强的问题分析和推进解决的能力;
简历投递邮箱:1656187442@qq.com
添加新评论1 条评论
2021-08-15 21:19