1. 阿里云运维技术栈:
• 熟练掌握阿里云专有云环境下的各项服务运维,包括 ARMS 应用实时监控、ASCM (阿里云控制台管理服务)资源管理、ASO (云原生运维服务)等。
• 对阿里云资源进行全面监控与精细管理,如利用 ASCM 进行用户权限分配、资源创建与删除、成本控制等操作。
• 熟悉 ASO 的功能,包括应用部署、配置管理、灰度发布、故障定位与修复等,助力云原生应用的高效运维。
2. ARMS 监控与告警:
3. MQ 消息队列运维:
4. 日常巡检观察天基终太,分析铜雀告警:
5. 阿里云 ASCM与 ASO 运维实践:
• 定期巡检:借助阿里云 ASCM 进行定期资源审计和巡检,如对 ECS、RDS、SLB 等资源进行状态监控和性能分析,确保资源合理分配和优化利用。
• 铜雀平台应用:运用阿里云铜雀平台进行深度运维数据分析和洞察,完成定期的数据库健康检查、性能瓶颈探测,实现提前预警和主动运维。
• 天基产品运维:深入了解天基系列产品特性,进行了终端数据分析、问题排查和故障预防,确保业务系统的稳定运行。
• 故障报告输出与问题处理:在发生故障时,快速生成详细的故障报告并通过 ASCM和 ASO 进行问题定位与修复,有效地协调团队资源解决问题。
• 日常巡检:每日通过 ASCM 平台对所有云资源进行常规巡检,结合阿里云监控服务和其他运维工具,提前发现潜在风险并进行预防性维护。