ID:244770

草帽小子

Linux运维工程师

  • 公司信息:
  • 达令心潮(北京)商贸有限公司
  • 工作经验:
  • 8年
  • 兼职日薪:
  • 800元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 北京
  • 海淀

技术能力

1. IDC改造:OpenStack改造升级,优化服务器生命周期管理,根据服务器功能不同进行解耦上架
2. 制定服务器申请规范和上线后服务器使用率标准:根据使用率进行业务服务器配置、节点数变更
3. 文档和流程方面:制定了详细的应急响应流程、大促保障机制、监控项梳理等流程和规范,以及运维架构文档的梳理
4. 团队建设方面:明确、细化人员分工,开放式管理,注重内部沟通和信息同步,有效提升了组内成员的参与度和责任感,团队成员技术能力和沟通能力有了较大的提升
5. 完善监控体系:系统监控迁移到zabbix,根据实际情况调整相应的策略,grafana+zabbix web展示;业务监控:graphite + +grafana 向prometheus+thanos+minio+grafana迁移
6. 协助开发微服务改造:集成kong(网关)、consul(注册)、Apollo(配置),APM工具pinpoint;探讨、执行迁移方案
7. 日志收集架构ELK设计、实施,并根据需求做出实时增减、策略等调整,集成ldap;
8. 完善备份体系:日志、OPS配置、定时任务、数据等
9. 中间件架构根据业务需求设计、维护、扩容、迁移:elasticsearch、zookeeper、kafka、rabbitMQ、pinpoint等;
10. 测试、压测环境、生产业务迁移至公有云,改造存储方案等;阿里云迁移至其他云的方案探研、制定、执行方案,总结成档;
11. 参与公司自动化、 平台化建设, 运维平台:工单系统、 CMDB 等等
12. 服务架构容器化(kubernetes)实施、后期维护

项目经验

一、业务服务改造、上云,不同公有云之间迁移
1. 需求:解决业务服务繁多,不方便维护、升级;提高应用快速扩展性,灵活变配;为节约成本,公有云之间迁移
2. 方案设计与实施
1) 结合企业应用场景,架构组和OPS探研、确定使用consul、Apollo、kong,APM工具使用pinpoint
2) 业务服务逐步接入业务consul、Apollo、kong、pinpoint,及时发现问题并解决问题
3) 成本、管理便捷性评估后确定:测试、压测环境、生产部分业务依次迁移至阿里云,改造存储方案(阿里云nas);
4) 公有云所有资源和中间件(es、kafka、rabbitmq等)迁移方案制定,并实施
3. 总结归档:将项目方案资料整理,并写总结文档

二、ELK集群搭建与维护
1. 需求:解决开发不登录服务器可以查看日志;减少操作系统操作人员,规避风险;问题定位效率低
2. 方案设计与实施:
1) ELK搭建(filebeat+kafka+logstash+es+kibana),集成LDAP用户认证
2) 搭建完毕,将开发和运维相关日志收集到ELK集群中,自定义dashboard和报警机制,开发使用验证
3) 开发验证无误,并确定ES中保留日志索引的时间
3. 总结归档:将项目方案资料整理,并写总结文档

三、CICD流程梳理、改造
1. 需求:解决服务交付时间长,交付质量差
2. 方案设计与实施:
1) gitlab代码库部署,项目管理;Jenkins持续集成,权限管控,项目矩阵权限划分
2) Jenkins和git配置LDAP登录,cicd流程梳理改造,提高服务交付效率(gitlab+maven+Jenkins+ansible)
3) 设定gitlab用户管理体系,提高代码安全性
3. 总结归档:将项目方案资料整理,并写总结文档

四、K8s架构设计、实践
1. 需求:微服务架构接入k8s架构
2. 方案设计与实施:
1) dev、test、uat、prod的k8s环境规划、架构部署,公共组件设计、运维
2) 配合开发服务改造,将服务逐步接入k8s集群
3) 改造cicd流程,保障服务高效交付到k8s’Prometheus高可用环境
4) dev、test、uat环境验证通过后,上prod环境
3. 总结归档:将项目方案资料整理,并写总结文档

四、建立、完善监控体系
1. 需求:解决不能实时知晓服务器和软件服务的动态,当服务器或服务出现问题会给公司造成直接损失,问题排查时间长
2. 方案设计与实施:
1) 硬件监控:制定相对应的监控方案公司服务器硬件、 系统、网络、应用监控,采用zabbix proxy架构
2) 业务/中间件监控:Prometheus高可用架构——prometheus+thanos+对象存储(minio)+grafana
3) 写自定义监控脚本监控并实时报警,结合grafana做展示,并集成ldap
4) apm工具:程序调用链监控方案选型确定,采用pinpoint并设计、搭建高可用架构
3. 总结归档:将项目方案资料整理,并写总结文档

五、权限管控,审计平台上线:开源跳板机jumpserver
1. 需求:统一登录服务器的入口,服务器免密登录,密码不可见,不同用户拥有不同权限,操作记录可审计
2. 方案设计与实施:
1) 使用开源的jumpserver作为跳板机,可实现上述功能,还有方便管理控制的功能
2) 单机版、分布式部署,集成LDAP用户认证,服务器使用树形结构管理
3. 总结归档:将项目方案资料整理,并写总结文档

案例展示

  • pinpoint

    pinpoint

    Pinpoint是一款全链路分析工具,提供了无侵入式的调用链监控、方法执行详情查看、应用状态信息监控等功能。 服务拓扑图:对整个系统中应用的调用关系进行了可视化的展示,单击某个服务节点,可以显示该节点的详细信息,比如当前节点状态、请求数量等 实时活跃线程图:监控应用内活跃线程的执

  • ansible配置管理

    ansible配置管理

    使用ansible命令或编写ansible-playbook,按组(嵌套)管理主机实现下面的功能: 1、实现批量操作系统配置 2、批量程序(一个程序或集群)部署 3、批量运行命令,完成指定任务 4、服务持续CICD

  • ansible配置管理

    ansible配置管理

    使用ansible命令或编写ansible-playbook,按组(嵌套)管理主机实现下面的功能: 1、实现批量操作系统配置 2、批量程序(一个程序或集群)部署 3、批量运行命令,完成指定任务 4、服务持续CICD

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服