1.精通python的运维工具开发和运维平台开发,如自动化脚本,平台,业务接口监控平台。
2.熟悉devops流程,为企业提供ci/cd持续集成,持续发布方案和技术。
3.熟练kubernets架构和维护,以及整套k8s的全方位监控方案和技术。
4.熟悉日志集中管理系统elk的各种架构和部署,自己调优。
5.熟悉mysql,pgsql等数据库的日常维护,调优,备份,恢复,集群架构部署。
6.熟悉各类四层,七层代理lvs,haproxy,nginx。
7.精通各类应用软件的,部署调优,如jenkins,git,redis,habse,kafka,rabbitmq,zookeeper等。
为公司的微服务集群打造企业级的监控室平台,prometheus+grafana监控k8s整个集群以及集群中所有的业务稳定性和资源
角色 | 职位 |
负责人 | Devops |
队员 | 前端工程师 |
队员 | 后端工程师 |
企业级监控平台,监控整个kubernetes集群以及所有pod的所有状态,以及系统资源,所有监控数据做持久化,保证数据的完整性
对业务接口进行监控,并将错误信息发送到企业微信或者钉钉群,通知相关人员处理,后续可加入故障告警自动修复,已经机器深度学习智能监控告警