熟练掌握Hadoop、Spark、Kafka等大数据处理框架的配置、部署和调优。
精通Linux系统操作和集群管理,具备丰富的系统运维经验。
熟练使用Zabbix、Prometheus等监控工具,能够实时监控集群状态和性能数据。
熟悉Shell、Python等脚本语言,能够编写自动化运维脚本。
具备良好的沟通能力和团队协作精神,能够快速适应变化的工作环境。
1.负责每日大数据原子能力开放平台巡检工作,保障大数据原子能力平台,报表中心,数据魔方等门户正常运行,保障大数据对外应用服务的稳定运行。
2.负责大数据安全管控平台日常巡检运维报障工作,对70个重要接口,停机模型,反诈应用排查,以及处理大数据安全管控平台配置单。
3.负责易运营系统日常监控运营工作,场景配置,程序监控,保障点火调度正常,并保证各个调度正常运行,系统正常。
4.针对日常工作需求编写相对应的shell,python 脚本,实现早晚自动化巡检,以及自动化跑数,工作效率提升50%。
5.对中间层表进行库表授权,针对报错进行处理,且配合中间层TeleDB数据生产环境发版重启运维,对telepg_monitor各插件升版后保障云平台正常运行,各模块正常。
6.负责处理OA系统上ITSM需求单,故障单,ACC账号权限单等,负责hw和重保期间各系统的巡检工作。
7.支撑spark集群空间梳理,集团文件梳理,协助集群报障告警处理,集群用户信息修改,配合telepg升版后业务验证,定期编写运营小结。
8.负责大数据原子能力开放平台PostgreSQL 安全漏洞修复