ID:313667

[太阳]

Java开发工程师+高级运维工程师

  • 公司信息:
  • 杭州
  • 工作经验:
  • 8年
  • 兼职日薪:
  • 800元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 杭州
  • 萧山
  • 新中南家园

技术能力

熟悉使用开源工具快速部署高可用k8s集群以及k8s的使用与维护
熟悉使用docker-compose或者helm部署K8s集群监控工具victoriametrics以及配置相关告警。
熟悉自建ci/cd相关工具,比如jenkins,gitlab/svn,harbor的部署,使用,维护,以及软件开发生产线华为云codearts,阿里云云效的使用。
熟悉使用openresty+naxsi实现防火墙版的高性能web代理,保证生产安全性
熟悉搭建企业级vpn工具Pritunl使其方便同事远程办公
熟悉分布式储存系统ceph高可用集群的搭建与维护,保证数据可靠性
熟悉阿里云的多种产品特点以及操作,包括ecs的购买选配、监控安装;rds、redis的管理和维护、oss的管理和维护、各个阿里云账号费用的预算管理等
熟悉node,php,python以及大数据算法相似度搜索工具比如Fasiss、Milvus的部署维护。
熟悉开源堡垒机jumpserver、测试平台metersphere的搭建和维护。
熟悉搭建Prometheus监控系统,包括prometheus、grafana、influxdb以及多种exporter监控探针的安装部署。
熟悉altermanager的监控系统搭建和告警配置,能够使用自有探针监控和实现自定义脚本进行监控,可以自己编写告警规则,并可以将告警信息输出到指定平台。比如企业微信或者钉钉。
熟悉日志收集系统ELK的整个搭建流程,包括filebeat、kafka、logstash、elasticsearch、kibana的搭建和配置,以及kafka集群的搭建和优化。
熟悉docker的常用命令,会编写dockerfile根据需求定制化的制作镜像
熟悉K8S常用命令对K8S平台进行运维操作,包括pod的查询、yaml修改、标签增删、以及生产环境问题的处理解决。
熟悉通过docker或者helm构建rabbitmq、rocketmq、nginx、redis、apollo、xxl-job、nacos、sentinel中间产品以及解决使用过程中的问题。
熟悉运用shell/window命令进行日常操作,包括shell中的grep、sed、awk进行文本处理。
熟悉分布式存储fastdfs的工作原理以及常用操作包括部署、配置、测试、文件迁

项目经验

1. 负责各个环境的k8s平台搭建与维护以及日常应用问题的沟通处理,保证生产的安全和平稳运行。
2. 负责项目由阿里云迁移华为云事项的规划和安排以及对阿里云、华为云资源使用的优化达到降本增效的目的。
3. 负责dockerfile以及jenkinsfile的编写和维护工作。
4. 负责java、go、php以及vue语言的容器化操作与测试、生产环境的部署以及问题沟通处理。
5. 负责前端、后端、测试、大数据所需环境的搭建和日常问题的沟通处理。
6. 负责jenkins、gitlab、svn、yapi,metersphere服务的搭建、维护以及迁移。
7. 负责jumpserver生产与测试环境的部署以及新机器的添加和权限分配。
8. 负责各个环境服务器告警接警的沟通处理,保证生产的安全与稳定运行。
9. 负责ecs相关指标月统计、各个账号阿里云预算、网络安全保测评等工作的处理和项目推进。
10. 负责各种脚本编写,涉及堡垒机添加新创建的主机、自动化容器发布、php、java、node、python等安装环境的编写。
11. 负责docker镜像的定制化制作,更新镜像并发布到生产平台,解决由镜像带来的应用问题。
12. 负责生产系统elk日志收集系统的搭建、测试、配置调优、调试以及解决日志收集出现的问题。
13. 负责使用常用探针+prometheus+grafana对测试和生产环境的主机以及应用系统实施指标采集和监控部署。
14. 负责使用Prometheus+alertmanager+告警消息推送脚本(python编写)+企业微信机器人实现监控告警。
15. 负责观云台(k8s可视化运维平台,类似于kubesphere)生产应用以及容器apollo、xxl-job、rocketmq等中间件的部署与问题处理。
16. 负责对程序进程、nginx、主机、数据库、jmx等监控的部署与部署过程文档的整改和编写。

17. 负责系统部署方案、系统应急手册、系统运维手册的编写和整改以及架构图的优化整改。

18. 负责配合开发人员部署应用和处理日志报错问题、包括日志导出、日志错误查找过滤、xxl-job的配置和执行、apollo的配置和发布。

19. 负责编写常用脚本,比如安装监控探针的脚本,提高工作效率,并协助同事解决疑难问题。

20. 负责数据库的部署、优化与日常运维,配合开发审核并执行数据库脚本、导出或者备份数据。
21. 负责Linux主流中间件(keepalived、nginx、rabbitmq、redis、ftp等)的安装和集群的部署、优化、测试以及对安装、测试文档的编写或者整改输出。
22. 负责zabbix监控系统的监控部署、告警处理、以及监控优化,包括监控参数阀值、添加新的监控项。
23. 负责使用ansible、shell语言编写常用安装中间件的脚本以及编写shell获取要向zabbix_server推送监控数据的脚本。
24. 负责公司国际宝腾项目运维(Window系统)的支持( 包括中间件(window服务nlb、nginx、rabbitmq、redis、minio、ftp)以及nlb+nginx(HA负载均衡)、redis(哨兵)、rabbimtq集群的部署测试、项目代码的部署测试以及中间件和集群的部署测试文档[中英]的输出、另对启动脚本进行优化并注册为window服务、对中间件及其集群和应用部署给客户进行培训。
25. 负责优化运维架构,比如中间件或者应用单点问题的解决、应用系统的调优以及应用系统突发故障的应急响应与开发会议沟通及时处理,保证生产的正常运行。
26. 负责linux服务器root权限回收工作的稳步推进、配合安全部门对扫描出的tomcat、nginx、等漏洞进行整改
27. 负责对生产服务器常见问题进行优化比如tomcat内存溢出问题、磁盘报警问题等进行分析优化
28. 负责提升公司基地基础it人员的中间件部署以及日常运维问题的处理能力,对日常工作中基础it人员提出的问题进行答疑解惑。
29. 负责oms、prometheus、apm(即Dynatrace)运维系统维护包括集团系统资源的录入、中间件自动部署的添加、agent、exporter的安装。监控面板的生成,为后续运维平台的转变,运维效率的提升做基础。
30. 负责临时担任公司的变更、发布经理,把控公司业务系统,基础设施、网络等变更发布的风险。

案例展示

  • k8s与运维平台

    k8s与运维平台

    自建k8s平台: 使用开源工具搭建k8s容器集群管理系统,供非生产所有环境的使用,并负责维护。 自建运维平台 使用开源工具搭建堡垒机运维平台,供运维人员日常运维使用,并负责维护。

  • jenkins项目构建平台

    jenkins项目构建平台

    自建jenkins项目构建平台 自建Jenkins项目构建平台,用于所有项目环境的自动化构建发布平台,提升开发人员的效率,让开发专注于业务逻辑以及代码的规范性。

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服