1.熟练使用linux操作系统(debian/centos),能针对不同业务类型进行linux系统层性能调优
2.熟练使用shell/python自动化/web开发,熟练linux环境基础工具链:grep,sed,awk,regex,tcpdump,iptables,git,vim等
3.熟悉网站C/S开发架构,熟悉常用的C/S架构软件如nginx,lvs,keepalived的部署,配置,变更
4.熟悉TCP/IP/HTTP协议栈,能快速定位linux下常见的网络问题,对分析服务器宕机原因有丰富经验
5.熟练使用各类型的raid/sas控制器软件,如megacli,arcconf,sas2ircu以及坏盘槽位定位
6.熟练使服务器批量操作工具/配置管理工具,如tmux,ansible,puppet,pssh
7.对运维相关系统如CMDB/监控/运管平台/工单系统等有深度使用经验
项目经历
MagicOS
2017年3月 - 至今
个人独立开发的简易单机操作系统,基于X86处理器,目前主要基于汇编+C完成MBR,bootloader,cpu实模式/保护模式切换,内存段页式管理,内存池分配,线程管理
服务器日志分析自动化报表
2018年7月 - 至今
使用rsyslog+nsq+elasticsearch+grafana完成上万节点(云主机+物理机)的syslog/ipmi/ssh/mcelog日志以及前端Nginx日志的搜集与分析,系统日志每日日志量1.5-2T,保存时间达到6个月。主要负责es集群搭建/运维,以及使用python+shell完成节点硬件故障分析程序,功能为每周定时从es拉取数据生成excel表,根据数据使用matplotlib绘图,使用imagemagick完成图片拼接处理生成报表,并自动发送邮件
磁盘自动更换系统
2018年1月 - 2018年12月
使用shell+python(Flask)实现的Rest api接口,该系统用于自动定位物理机的各类故障磁盘的槽位定位,并自动在raid控制器上亮灯,适配各linux发型版以及多种raid/sas控制器等复杂场景。在磁盘更换完成后自动恢复原先的raid配置,分区格式化并挂载回原处。