1. 熟练掌握 Centos/RedHat/ubantu 等常用系统。 2. 具有 aws 云 青云,微软云,阿里云,七牛云,白山云管理经验,并能通过业务应用场景合理选 型。有大型云服务器与混合云机器管理经验。 3. 认同 devops 工作模式。 4. 熟练掌握 docker 容器与 cgroup 内核概念,有容器生产使用经验。 5. 熟练掌握 jvm 调优参数及 gc 垃圾回收原理。 6. 熟练掌握 k8s 体系,掌握 rancher 体系,有 k8s 及 rancher 生产环境使用经验,能对集群进行排错 调优,k8s 体系能熟练应用于业务。熟练掌握 helm 部署 7. 熟练掌握目前主流 nosql 数据库,并可以对 redis 进行高可用,对主流 nosql 进行搭建及维护 如: redis 主从,sentinel,Cluster。有高并发生产 redis 运维经验。 8. 熟练掌握当前主流 MQ,如:RabbitMQ 单节点和集群,ActiveMQ 单节点及结合 Zookeeper 高可用 方案,Kafka 和 Kafka-manager 单节点搭建及集合 Zookeeper 高可用方案。 9. 熟练掌握 ELK 和 EFK 搭建维护并且改良支持高并发日志收集,协助搭建大数据日志收集: Flume+Kafka+Zookeeper+Kce+Elasticsearch+Kibana 与 elk 周边插件部署。 10. 熟练掌握 zabbix 监控系统与 Prometheus 监控体系搭建并维护,如设置邮件报警,短信报警,添 加脚本监控等 11. 熟练掌握 MySQL 与 neo4j 数据库的性能优化调优及 SQL 语句,并实现数据库高可用。
12. 熟练掌握 gitlab,gitlab-ci,Jenkins,CICD 上线工具及 sonar 和 gerrit 代码规范工具。能进行代码 自动化部署和容器自动化滚动更新发布。 13. 熟练掌握目前主流调度工具,如 nginx,haproxy,LVS 并结合 keepalived 进行高可用,云服务如 ELB,SLB。有高并发网站架构经验。 14. 熟练掌握存储服务搭建使用,如:NFS,MFS,FASTDFS,CEPH.CLUSTER 等。 15. 熟练掌握 salt 和 ansible 自动化运维工具,salt 运维 100+AWS 云机器。熟悉基本命令操作。 16. 熟练掌握 LDAP 及 keyclock 及自助密码服务及 Prometheus 和 granfana 数据可视化维护,熟悉 openstack 简单操作及维护。 17. 掌握 shell 编写及正则,如,grep,awk,sed,一键安装脚本及生产环境脚本等 18. 掌握 python 简单自动化运维脚本编写。 19. 熟悉搭建使用 Openvpn 及 SSvpn,熟知 OSI 七层模型和 TCP/IP 五层模型 20. 熟练掌握 nexus 构建仓库与 harbor 镜像仓库,与 maxwell 数据库同步工具和 ignite。 21. 熟悉 gravitee-apigateway 网关进行限流熔断。 22. 了解 servicemash 概念,测试环境使用过 istio 与 linkerd 替代 kube-proxy 进行 grpc 分流。 23. 熟悉 sentry 工具与 jumpserver 跳板机。
1、负责阿里云生产环境和IDC日志处理环境以及测试环境的k8s日常维护。
2、负责IDC搭建维护ceph和k8s系统,同时打通阿里云、IDC网络、测试环境的网络。
3、负责优化es系统以及ingress 日志迁移至IDC日志处理环境。
4、负责k8s监控系统搭建维护,定义报警规则实施。
5、优化现有自动化系统、gitlab部署流程,提高研发开发部署效率。
6、负责所有项目的helm Chart包编写和维护。
7、编写python和shell脚本完成每天数据统计以及报警。
8、解决研发、产品日常疑难杂症。