编程:熟悉Python、shell语言,熟悉flask、django;
监控:基础、业务监控脚本编写、指标采集分析,熟悉open-falcon、promethues、grafana等;
应用:熟悉nginx、consul、zk、lvs等常用应用软件;
存储:熟悉mysql 、redis、ssdb、mycat、twemproxy等;
虚拟化:熟悉docker、vmcenter、阿里云控制台各模块等;
业务上云:
项目描述:废除物理机房,业务迁移至阿里云。
项目责任:
1. 迁移各业务应用模块及数据,更新旧的过时不安全的版本;
2. 完善新集群的监控;
3. 业务迁云后的观测与维护。
基础监控平台建设:
项目描述:新建设采集汇总基础及业务状态并告警的平台。
项目责任:
1.平台登录页面编写(python);
2.采集脚本;
3.接入接口。
部署esxi主机监控:
项目描述:新上线的360台esxi系统的服务器监控空白,为防止母机故障而造成损失,对其硬盘、存活等进行监控。
项目责任:
1.整理各个机房节点的esxi管理主机,对其系统编号进行分类并部署远程管理工具;
2.编写主机存活、内存、硬盘信息的监控脚本并部署至所有的主机;
3.Vmware ESxi 管理;
离线服务器下架及复用:
项目描述:由于业务的调整,公司下架4000台服务器,并复用三个机房。
项目责任:
1. 销毁硬盘数据;格式化、dd、再格式化及初始化;
2. 复用离线gfs chunk server。
10000+服务器的mrtg部署与维护:
项目描述:流量图起到流量计费、显示业务状态、网络质量等作用,故公司对所有服务器、交换机部署流量图。
项目责任:
1.协助通过rsync、nginx等工具实现所有服务器mrtg页面显示,编写流量图部署的自动化脚本;
2.编写监控脚本,上报流量图异常的主机及交换机;
3.排查流量图异常的主机并处理,以免影响计费及业务