(1)上线保障;

对系统各项技术指标进行监测、定期检查;

对系统实现的业务功能点进行检查,业务功能指标进行检查;

(2)巡检保障;

对常规技术指标进行检查,例如 内存、磁盘和CPU使用率,进程状态等信息

人工定时巡检业务功能点,比如交易数量,订单响应数量,订单积压数量,订单拒绝数量

(3)日常监控;

应用层面监控,系统日志监控,数据库的数据信息监控

主机层面监控,内存、磁盘和CPU使用率等信息进行监控

(4)应用工单支持;

实现工作台,根据业务人员ERP工单,技术人员的ITSM,EQOPS工单,由开发提供手册,测试完成后,运维根据手册完成生产操作

(5)常规版本上线;

参与需求评审

开发设计评审

版本上线评审(整体)

开发:本次的变更点,版本发布内容。需求文档、接口文档是否进行了更新。升级手册是否规范,架构设计是否合理。上下游系统是否就绪,是否存在影响核心系统的风险点。系统性能、容量是否满足要求或能够支持大请求的情况。

测试:准入测试、针对性测试、功能性测试、性能测试、回归测试、联调测试、安全测试

运维:环境是否就绪。业务流程是否涉及到特殊保障。

根据jira、ITSM软件发布流程完成版本上线工作

(6)事件处置;

牵头完成生产事件的处置,根据应急预案和应急测试完成的手册进行生产处置

例如:存储网关文件处理异常;实例僵死,初步排查原因、进行重启等

完成事件进展通报,事件总结,事件管理,事件转问题管理

(6)系统可用性排查

定期回顾系统存在的风险,可用性是否满足要求,是否需要进行优化,如优化架构,进行性能扩展

(7)应急演练;

根据事件定期回顾,完善应急预案,进行生产环境的应急演练,生产环境无法复现的,进行沙盘推演。

Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐