超大规模集群运维经验,具备良好的稳定性意识&风险识别意识,负责线上集群稳定性相关工作(了解部分大公司运维体系)
熟悉云原生运维场景,具备百万级别容器监控集群落地经验,转发代理组件编写经验;
了解运维各方向前沿落地现状:单元化、弹性伸缩、蓝绿发布、智能巡检、新一代监控VictoriaMetrics
技术工具范围:go、mysql、grafana、VictoriaMetrics,redis
百万级别容器监控部署方案落地经验 - VictoriaMetrics、grafana
转发代理组件搭建经验 - go
内部运维小工具平台开发经验 - go、python、redis、mysql、
角色 | 职位 |
负责人 | sre |
队员 | 后端工程师 |
探索新生代云原生监控、最终支持百万级别容器监控指标采集 从技术调研、云原生部署、接入优化、架构改造、外部转发代理&访问控制组件开发全流程参与&主要开发人员
内部监控报警分析,面板展示,针对报警信息进行分类汇聚,关联核心的监控指标进行信息提示,基于lowcode平台搭建简单页面