1. 负责整体技术架构选型及部署实施
2. 使用 Go 开发 node controller,实现 kubelet endpoints 的自动更
3. 配置 hashmod 解决 prometheus 无法支撑单个大集群以及多副本 prometheus 重复拉取指标的问题
4. 使用 Go 开发 alertmanager webhook ,并基于飞书机器人配置自动重载
5. 编写 alertmannager 和 thanso ruler 告警规则以及 prometheus record 优化查询语句