互联网服务方案运维工具

运维的日常工作、开发平台及工具?

业务运维工程师的日常工作包括:

1、监控线上的服务质量

2、响应异常/处理突发故障

3、在线发布/升级产品和相应产品线的研发和测试协调处理产品问题

4、基于工作中的问题和数据分析进行抽取,将运维经验理念落地沉淀为方法论/工具/系统/平台,并制定相关的改进计划,在各个技术方向上落地实现,最终反馈回运维工作中,提高运维本身的效率和产品的价值。

参与7

2同行回答

docdoc项目经理长春理想
医疗大数据项目经过系统试运行和最终验收后就进入运维阶段了, 项目所涉及到的硬件设备按厂商的规定进行保修(一般是三年)、软件产品按合同约定进行保修。 此次大数据项目的实施包括基于spark开发的医疗大数据分析系统,以及为大数据分析系统做支撑的服务器、存储、网络及安全...显示全部

医疗大数据项目经过系统试运行和最终验收后就进入运维阶段了, 项目所涉及到的硬件设备按厂商的规定进行保修(一般是三年)、软件产品按合同约定进行保修。
此次大数据项目的实施包括基于spark开发的医疗大数据分析系统,以及为大数据分析系统做支撑的服务器、存储、网络及安全设备等已经从实施进入运维阶段。

运维工作需求分析: 一流的运维服务体验来自于以用户服务为核心的策略,如何保障医疗大数据分析系统稳定的运行是运维工作的重点,经过与用户的沟通确定了如下的用户需求:

1. 提高运维工作效率,运维的及时性,准确性。

2. 运维人员绩效考核,有利于提高运维工作效率,有利于运维工作的创新,有利于提高工作的积极性和主动性。

3. 巡检是运维工作的日常内容。确认设备的巡检周期,建立并执行应用系统巡检制度,制定巡检工作流程单,按流程按时按要求对设备进行巡检。

运维方案的制定: 运维方案包括组织架构,运维要求,运维方式,管理制度共四个方面。

组织架构: 以总经理牵头,下设运营部、市场部和技术部;在运营部下设人事、行政、商务、采购、财务等部门;在市场部下设销售部、市场部、产品部和客服部;在技术部下设系统集成部、运维管理部、售前方案部等部门。

运维要求: 根据出现问题的紧急程度,确定非常严重、严重和一般三个等级。根据问题的紧急程度确认响应时间,2个小时以内、4小时以内、8小时以内,

运维支持的方式包括现场支持、电话邮件支持和远程协助支持。

运维方式: 根据运维工作的需求和运维响应时间要求决定建设完整的运维计划并确定服务的标准,以现场软硬件巡检为主,增强运维计划的执行力,下面是运维工作流程:

建设完整的运维计划:在整个运维过程中,计划是整个工作流程的核心,按照计划先行的原则,依据本年度工作计划制定分项工作计划和时间维度计划,并按流程、按计划进行实施和保障。

现场巡检的重要性:现场巡检计划是运维工作计划的重点,通过现场巡检能够发现系统薄弱环节、关键业务节点、存在的隐患,尤其是对制定应急预案及备品备件计划至关重要。

执行力的重要性:运维计划的执行是运维工作的重点,在运维计划执行过程中,应严格按照流程规范开展运维,并注重控制以降低运维风险。针对运维执行情况,应定期向用户进行反馈。

服务标准:签订售后服务承诺函与用户约定服务级别,对于所承诺的服务级别包括提供的资源(备品和备件等)、提供的方案应严格按约定执行;

管理制度: 包括运维工作流程管理,机房环境巡检制度,服务器、存储、网络及安全设备等巡检制度,应用系统巡检制度等相关内容。

收起
系统集成 · 2021-07-09
浏览811
行云管家行云管家技术布道师深圳市行云绽放科技有限公司
基础运维工作内容包括哪些?1、服务监控技术:包括监控平台的研发、应用,服务监控准确性、实时性、全面性的保障;2、服务故障管理:包括服务的故障预案设计,预案的自动化执行,故障的总结并反馈到产品/系统的设计层面进行优化以提高产品的稳定性;3、服务容量管理:测量服务的容量,规划服...显示全部

基础运维工作内容包括哪些?

1、服务监控技术:包括监控平台的研发、应用,服务监控准确性、实时性、全面性的保障;

2、服务故障管理:包括服务的故障预案设计,预案的自动化执行,故障的总结并反馈到产品/系统的设计层面进行优化以提高产品的稳定性;

3、服务容量管理:测量服务的容量,规划服务的机房建设,扩容、迁移等工作;

4、服务性能优化:从各个方向,包括网络优化、操作系统优化、应用优化、客户端优化等,提高服务的性能和响应速度,改善用户体验;

5、服务全局流量调度:接入服务的流量,根据容量和服务状态在各个机房间分配流量;6、服务安全保障:包括服务的访问安全、防攻击、权限控制等;7、服务自动发布部署:部署平台/工具的研发,及平台/工具的使用,做到安全、高效的发布服务;

8、服务集群管理:包括服务的服务器管理、大规模集群管理等;

9、服务成本优化:尽可能降低服务运行使用的资源,降低服务运行成本;

10、数据库管理(DBA):通过设计、开发和管理高性能数据库集群,使数据库服务更稳定、更高效、更易于管理。

11、平台化的开发:类docker等平台的开发管理,及服务接入技术等等。

当然随着时代的变化,云计算时代的大背景下,很多公司基础运维工作也发生了一些变化:

1、快速创建和复制云主机资源模板,为不同业务团队配置性能合适的主机模板,以及主机资源申请、创建、交付、运维以及最终的释放销毁的全生命周期管理;

2、还有应用程序和支持软件的安装部署/交付和升级,集群性能负载均衡调配、服务器的批量脚本操作、数据库维护、主机的监控、运维日常工作的审计等等;

3、多云情况下,各云使用的费用情况也需要统计和分析等等。

基础运维所需学习基础知识

1、微软系统

2、Linux/BSD系统

3、编程开发

4、网络配备

5、存储

6、操作系统以及应用程序层面上的技能

给力的基础运维工作方式-使用云管平台

作为业界领先的多云管理平台,行云管家是国内唯一一家以SaaS形态提供的云计算管理平台,为您提供以下7大核心功能:

1、支持业界主流公有云厂商,以及OpenStack、VMware等私有云设施;

2、提供基于工单流程的云资源申请、创建、交付、运维、销毁全生命周期管理;

3、从系统安全、网络安全、性能负载、趋势预测4个维度实现主机的监控与体检;

4、内置堡垒机模块,承担起用户在管理IT资产的运维中枢、会诊平台和“事前授权、事中监管、事后审计”的黑匣子等职责,全面保障企业IT资产的安全运维、合规审计;

5、分析读取公有云账单,从各个维度分析云主机的各项成本支出,通过对应用负载的数据挖掘,告诉您如何进行云资源的增减配;

6、自动化运维,提供脚本/命令批量执行、预设脚本库、文件自动分发/收集、任务编排等自动化运维特性;

7、支持SaaS形态和私有化部署形态,只需注册开箱即用。

收起
互联网服务 · 2021-10-09
浏览672

提问者

左耳,
软件开发工程师国药菱商
擅长领域: 存储灾备服务器

问题来自

相关问题

相关文章

问题状态

  • 发布时间:2021-07-08
  • 关注会员:3 人
  • 问题浏览:1402
  • 最近回答:2021-10-09
  • X社区推广