精通centos系统和常用软件维护,例如nginx,php,tomcat,mysql等等。
精通shell脚本和python编程。shell脚本多编写用于项目维护和部分日常工作处理。python脚本多编写用于运维工具开发。
系统和软件监控是最熟悉的模块,常用zabbix,prometheus,elk监控,脚本监控等。
运维架构调整和部署。salt, gitlab,jenkins等
熟悉k8s使用
运维后台的开发(django):可视化服务器资管理,自动化部署业务和备份数据,配置集中管理。主要进行了后期的更改维护。和独立完成部分新增功能。
监控平台的开发(drf): 整合各大工具的告警,集中发送到告警平台,分组告警。屏蔽重复告警和不重要告警,分析告警。方便查看历史告警。主要完成了所有的后端开发。
ELK:独立完成elk使用评估、搭建、接入。
prometheus: 独立完成prometheus使用评估、搭建、接入。
使用django开发运维后台,可视化集中管理服务器资源,自动化批量部署软件和业务,集中管理备份任务。大大的减少的运维人员日常维护业务时间,也方便了资源统计和查看。主要编写了告警统计和配置管理这部分的功能。告警统计主要方便查看所有资源使用情况,进行资源调整,降低服务器费用;告警自定
在实际运维工作过程中,我们会用到多种告警工具来完成不同的告警需求。消息发送邮件或者飞书、钉钉,但是告警消息过多,导致会漏看告警消息,且无法对一段时间内的告警量做出准确的评估。运维告警平台就是将所有的告警都发送到统一的网站,方便查看和统计和屏蔽