基于Prometheus生态,打造公司自研运维产品。提供主机,各种关系型数据库,内存数据库,mongo,tomcat,nginx,服务,容器,spark\hadoop\hbase\kafka\flink\zookeeper集群的运行监控,告警,自动恢复功能,提供操作日志,访问日志,运行日志的分析功能,提供服务异常溯源功能。
负责产品设计,技术设计,prometheus、alertmanager、blackbox_exporter三者的内置到容器的方案设计。
负责自动化埋点监控程序的编写、工具制作,使用java+jsch+openssh支持windows的远程自动化部署监控。编写自定义监控指标。使用goland编译国产化arm64们架构监控程序包,部署到容器。