01.熟悉 阿里云、AWS、腾讯云等常规IAAS层产品,计算、网络、存储、安全等。
02.熟练 使用golang、python语言完成开发任务。精通 脚本编程shell。
03.熟悉 虚拟化、Docker 容器以及 K8S 集群编排调度等技术并具有生产环境部署维护经验。
04.熟练 使用 ELK,部署多维度的日志集中收集展示平台。
05.熟悉 监控软件Promethus、open-falcon等,能够配置对线上服务器进行监控。
成本优化
内容:
1.参与服务器硬件优化:使用AWS Saving plain 让实例尽量全覆盖;采用 arm 架构实例;优化 Pod request 和 limit 值选择合适的实例类型;减少集群节点数;
2.参与服务自动伸缩带动节点扩缩:包括 hpa、 node 动态扩缩容、服务启动参数优化等。
3.参与服务可用性保障:包括 Pod startUP\liveness\rediness 探针优化、Pod preStop 机制、ELB 负载均衡配置优化等。
4. 参与混合实例部署:采用 pod 节点分布约束功能,节点按需实例与 Spot 抢占实例混合。
业绩:
1.参与成本优化工作,使 AWS 运营成本减少 40%。
承担运维工作 1. 负责 Ludo 业务运维维护管理 ,包括自动化发布、监控、成本管理、稳定性保险 2. 协调沟通测试、研发完成故障演练、安全修复、RCA 报告、微服务上云等工作。 3. 负责 AWS 云平台产品维护管理,包括 EKS、S3、ECS、SLB、VPC等产品。
承担运维工作 1. 负责大数据生态建设与维护,包括 hadoop、zk、spark、hive、hbase、kafka、flume、sqoop、zeppelin、greenplum等应用,基于数据快速分析出用户画像以及业务响应能力。 2.负责云平台自动化工具开发,实现证书自动更
承担运维工作 1. 负责公司的自动化建设,利用bash、python、go开发运维工具,提高运维效率。 2. 参与智能化运维aiops,基于janusgraph图数据展示根因分析,快速追踪事故根本因素,故障自愈,借助智能化的技术提升高可用的能力和效率。