10多年Linux系统运维之路,从机房、硬件、网络到上层应用的全栈运维;精通各种集群架构服务安装部署、配置、优化和运维管理,在大数据hadoop、虚拟化、容器、k8s、监控、高可用、高并发及自动化运维等方面拥有丰富的实战经验和技术能力。
1、IDC机房设备上架、网络规划布线、硬件设备等基础设施维护;
2、常见互联网高可用、高并发架构设计、运维管理、故障处理;
3、精通常用操作系统及中间件技术;
4、熟悉常见开发框架,如:PHP、Java spring boot;
5、虚拟化平台: kvm、vmware、k8s、docker;
6、基于 linux 平台常用软件集群、监控告警平台、devops平台等。
1、负责企业的大规模服务器集群管理,标准化的运维流程体系,自动化部署和监控报警系统,提高了运维效率和系统可靠性;
2、根据项目需要搭建统一的代码质量、容器漏洞、依赖漏洞、源码敏感信息自动化安全扫描系统;
3、为某物业公司80多个停车场实现统一监管平台;
4、建设虚拟化平台,节约物理资源、管理成本;实现快速交付、故障HA保障;
5、某交管局大数据中心无法提供数据,hadoop平台集群故障处理。
根据业主需要,编写一个适合公司架构的自动化安装部署应用工具;此工具主要采用ansible-playbook,一键自动化安装公司常用中间件及集群。
通过prometheus,为企业搭建一套统一监控告警平台;实现对所有资源使用情况、应用状态等全方位的实时监控告警,达到故障及时知晓并处理、问题提前预警的目的。