熟悉linux系统管理和日常维护
熟悉shell脚本编写,awk,sed,grep,命令使用等进行文件处理以及日志分析
熟悉ansible自动化管理工具使用以及剧本编写
熟悉LNMP架构环境部署以及优化
熟悉nginx反向代理,keepalived高可用方案
熟悉zabbix监控软件安装配置,配置自定义的监控项,
熟悉MySQL数据库基本操作以及备份恢复,redis的维护,熟悉postgres数据库的维护
熟悉docker,k8s部署及应用
熟悉阿里云,腾讯云产品的使用
熟悉rabbitmq的安装以及使用
熟悉ELK的部署以及维护
获得证书: Kubernetes 管理员认证 (CKA)
ELK 部署上线
项目背景:
公司集群环境错误日志多为了更好的让开发排查错误搭建 EFK 日志收集系统,供开发,测试人员查看业务程序日志
解决方案:
1,在公司服务器上使用 docker 部署 ELK
2,业务系统使用 filebeat 收集日志发送到 es
3,kibana 作为展示页面,为每个日志创建索引以便提供日志查询
项目结果:
1,提高了排查错误工作效率
2,方便管理错误日志
3,减少不必要沟通的成本
客户使用我们的只能语音产品的某一个功能后出现了502的现象,经过我们排查日志,分发现是超时时间不够需要优化nginx参数
业务在运行中有部分客户反映是有卡顿现象,我们介入后查看有部分地区是由于网络上的原因是有出现卡顿的现象,经过优化网络后解决