熟练掌握Docker相关技术,包括资源限制、数据持久化、docker compose、Dockerfile文件编写以及Harbor镜像仓库管理;
熟练掌握Kubernetes集群管理 、Pod控制器,资源限制、数据持久化和Helm工具等;
熟练掌握Iptables防火墙,能够灵活配置规则,实现负载均衡、流量管理、网络安全等需求;
熟练掌握MySQL数据库基础服务、读写分离搭建 ,以及Redis中间件集群化,数据持久化等;
熟练掌握 Nginx、Apache、Tomcat 等 Web 服务的搭建,能够集成 PHP以创建动态网页;
熟练掌握存储服务MFS、NFS、iSCSI ,解决数据冗余、数据备份以及数据恢复;
熟练掌握LVS的NAT、TUN、DR等工作机制部署高可用集群,以及调度算法如轮询、加权最少连接,实现高效的请求分配与负载均衡;
熟练掌握Zabbix 监控的部署及自动发现、自定义监控、钉钉告警功能;
熟练掌握Prometheus监控指标收集、警报规则配置等,以及和Grafana 等可视化工具集成;
熟悉Ansible自动化运维部署工具,了解的工作原理和工作流程;
熟悉Shell 脚本编写,用于部署应用、定时计划任务、备份策略、自动化文本处理等;
熟悉OpenStack的,nova、cinder、keystone、nuetron等主要组件;
熟悉腾讯云产品,如CVM、COS、CDN、EO、VPC等;
参与项目初期的系统结构规划,选择所需的服务器,以及k8s集群的部署,EFK日志收集搭建、数据库的搭建,Harbor仓库的搭建;
根据开发部门的需求制作Docker镜像,上传到搭建的Harbor仓库、并维护该私有仓库,同时根据需求创建资源清单、编辑pod控制器;
负责使用Helm部署 Prometheus监控系统,监控Kubernetes集群以及数据库中间件;
根据项目需求进行应用的更新,以及用灰度发布进行版本的更新故障时的回滚;
负责LVS+keepalive负载均衡、存储MFS、数据库MySQL、Redis的集群搭建;
部署Zabbix监控,对硬件、服务器和数据库进行监控,并设置报警规则;
进行日常工单的故障处理,保证服务器上应用的稳定运行;
利用cron任务来实现定时备份,保证数据安全,以及故障时数据恢复;
负责日志的切割轮替(logrotate),过期日志的清理工作;