基本信息

案例ID:171279

技术顾问:newMorning - 5年经验 - 某上市互联网公司

联系沟通

微信扫码,建群沟通

项目名称:监控告警平台

所属行业:企业服务 - 安全服务

->查看更多案例

案例介绍

● 该项目基于Prometheus、Grafana、Alertmanager实现,由本人独自完成上线
● 个人分工:环境整合部署上线、根据需求编写探针脚本、配置告警规则、编写监控大屏看板等,实现对服务器、网络设备和IT服务的各项指标进行监控及展示,并将告警系统接入企业邮箱、企业微信机器人、腾讯云短信、腾讯云电话等平台。
1. 监控大屏看板对IT部网络资源、各类服务、SSL证书、服务器性能、机房环境等进行全天候监控。自行编写了服务器温控metrics,实现了机房环境远程监控。提高了IT同事在应对各类突发故障时的响应速度及排障效率。
2. 编写了各类探针脚本,如基于ESXi和Storcli的磁盘健康探针脚本、基于snmp的服务器BMC监控脚本;
3. 对机房节点进行批量部署node_exporter,对服务器性能进行更加详细的监控,并定期对CPU、内存等性能指标进行百分位分析,合理分配机房容量,提高了节点利用率。

相似案例推荐

其他人才的相似案例推荐

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服