1. 熟悉公有云阿里云、AWS、腾讯云。
2. 熟悉shell、python、go编程,能熟练运用shell及awk,sed,grep等文本处理工具编写系统批量部署,日志分析,数据备份,定时任务,服务监控等脚本。
3. 熟悉tomcat,nginx,redis,mongodb等等web应用服务器的配置、管理、优化。
4. 熟悉lvs+keepalived四层负载均衡集群及nginx/haproxy 7层负载均衡与反向代理构建及优化。
5. 熟悉MySQL数据库应用及其高可用方案和集群部署,熟悉SQL语句。
6. 熟悉iptables规则,可根据生产环境具体需求进行配置。
10. 熟悉虚拟化技术xenserver、VMware-EXSI、kvm,了解openstack,docker,kubernets。
11. 熟练Linux下LVS、Apache、Nginx、Tomcat、MySQL、Oracle、PHP(FastCGI)的配置及参数优化。
12. 熟练MySQL、Oracle数据库安装、维护,熟练配置并管理MySQL主从、keepalived高可用应用,OpenVPN安装部署。
13. 熟练构建实时的服务器监控平台,利用zabbix、Nagios、Cacti监控报警及时处理线上服务故障。
14. 熟悉配置管理部署Jenkins、nexus、svn、gitlab、fastDFS、ELK服务及日常维护。
15. 熟练配置PSSH/Ansieble,saltstack进行批量服务器自动化管理,统一部署安装和配置管理
一. Jenkins自动化系统
背景:公司有10+台服务器对公司项目提供服务,有新版本更新时要进行,代码下载->编译->打包->上传,逐个向节点服务器分发文件,耗时,传输效率极低,工作率低下。
1. jenkins的安装部署,配置。
2. 自动化部署脚本, 远程执行。
3. 配置jenkins任务,持续的软件版本发布/测试项目。
4. 实现一键式,代码自动更新,自动部署。
二.服务器集群监控系统(zabbix)
背景:公司服务器集群架构为SLB轮训->-Nginx反向代理->WEB服务器->Mysql数据库,出现无响应或者响应慢的故障时,无法定位问题所在,部门之间相互推诿。
1. 常规监控(频次1分钟)CPU、内存、硬盘、带宽(OUT/IN)、负载
2. 日志分析统计及异常数据监控
3. Nginx,Squid,请求响应时间监控及报警
4. HTTP请求健康状态(状态码)监控,抓取异常访问
5. 统计所有URL(截取后)访问量,分析异常URL,抓取异常ip并用iptables进行 封停
6. 分析异常URL的IP来源分布,错误日志监控及报警,Nginx服务器每个域名的访问量
7. PV,UV,独立IP分析与统计,Netstat连接数监控