简介:
1、人选5年互联网运维经验;
2、致力于SRE方向的精进,利用Linux背景+Python全栈技术,推动Devops的落地;
3、良好的文档整理编写能力,方便项目的交付及维护;
4、极致的代码编写规范,效率第一;
5、负责维护云原生平台落地,维护,管理。对实际生产需求有使用经验和指导帮助
6、习惯关注CNCF沙盒项目,对开源技术的持续追求和自我核心竞争力的追求。
工作职责:
1、负责kubernetes平台的搭建和维护;
2、负责云原生cicd工具链的搭建维护;
3、kubesphere开源平台搭建维护;
4、腾讯云平台维护及私有化部署
技术栈
云原生: docker,kubernetes,kubesphere, istio
工具链: gitlab,jenkins,jira core ,confluence,harbor
其他: prometheus,alertmanager,grafana,influxdb,mysql,nginx,haproxy,
redis
开发: python
Prometheus监控平台的全面搭建
数据收集层使用exporter作为探针采集数据
Node exporter/Wmi exporter作为基础服务器的数据采集,目前稳运行并监控了
1600+服务器
数据库的监控包括OracleDB exporter、Mysql exporter、Mongo exporter、Redis
exporter等
日志监控利用Gork exporter或从Splunk数据源抓取数据,或利用Python自建采集端
中间件监控利用了RabbitMQ exporter、Kafka exporter等,或利用Python自建采集端
业务监控利用Query exporter交互查询SQL或者利用Python编写Exporter
数据汇集层利用Prometheus作为监控平台