项目制 全国远程
描述:本人6年运维经验,目前在某行业头部机构担任运维工程师、DBA。 熟悉linux各种常用系统、有各种组件运维经验,以下为大概涉及到的技术栈关键词:golang/shell/阿里云/腾讯云/mysql/clickhouse/druid/redis/nginx/kafka/es/hdfs/ansible/git/docker/contianerd/jenkins/k8s/docker/helm/grafana/zabbix/promethus 最好是长期兼职,北京地区可偶尔碰头,v: Booo-_,注明来意~。
1. 负责公司Saas可观测性平台维护,k8s node节点有将近100个节点,所有数据中心业务微服务约500多个,负责部分业务线应用的运维工作包括日常变更、故障处理、成本优化、性能优化、可用性的提升。
2. 负责公司clickhouse的运维工作,Saas平台数据存储主要使用clickhouse存储性能数据,负责clickhouse日常变更、故障处理、数据备份、完善监控、提高数据库的稳定性与可用性。
3. 负责将公司的可观测性平台进行容器化进行私有化交付,日常发版、部署优化、提高服务的健壮性、故障处理、定制化开发。
实现类似于Helm Chart功能将k8s workload统一使用value.yaml集中管理,并实现安装、卸载、更新在k8s上面
实现zabbix-sender功能并发送告警,使用golang开放的监控脚本,能够添加指标输出到zabbix