ID:342713

Lanyc

运维开发工程师

  • 公司信息:
  • 深圳十米网络科技有限公司
  • 工作经验:
  • 4年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 深圳
  • 南山

技术能力

熟练掌握 Linux、Centos7/8/Ubuntu操作系统的配置、管理、优化
熟练掌握 Shell 脚本的编写,了解Python脚本编程语言
熟练掌握Sed,Awk,Grep等日常使用的命令
熟悉Web 服务器,Nginx,Tomcat,Apache 的部署和调优
熟悉Prometheus、Zabbix运维监控工具的安装部署及使用
熟悉Nginx负载均衡和 keepalived 实现集群高可用
熟悉Ansible自动化运维工具,编写Playbooks剧本运用
熟悉ELK日志分析平台的部署使用
熟悉阿里云、腾讯云、华为云、微软云的公有云运维使用
熟练掌握 Mysql、Redis的基本操作,熟练掌握 Mysql 的数据备份迁移和主从复制
熟悉Gitee+Jenkins+Ansible+docker+harbor构建CICD持续集成部署与运用
熟悉Docker容器技术。 具备部署和管理Kubernetes集群的经验

项目经验

项目一:十米监控与日志管理系统
技术栈:Docker Docke-compoes ELK Filebeat prometheus Grafana
项目介绍:公司设备需要进行迁移,在该项目中,我设计并实现了一个ELK实时日志分析系统和prometheus监控系统,用于高效地监控和分析公司服务和应用程序的性能和安全状况。 日志系统整合了多种数据源,包括服务器日志、应用日志和网络流量数据,监控系统监控多种指标,包括服务器的性能、应用服务进程、错误日志,以实时地发现和警报潜在的问题,从而提高应用服务系统的可靠性和性能。

在公司设备迁移前,我们面临着日志分散、性能监控不足等问题,导致问题诊断缓慢,影响了服务的稳定性和响应速度。我负责构建了ELK实时日志分析系统和Prometheus监控系统,旨在全面提升性能监控和安全分析的效率。通过ELK系统的部署,成功整合了服务器、应用以及网络的日志数据,极大提高了日志查询和问题定位的速度。Prometheus系统则实时监控关键性能指标和错误日志,使我们能够快速发现并响应潜在问题。
这些改进显著提升了系统的可靠性和性能,具体体现在故障响应时间缩短了40%,系统稳定性提高了25%。极大地增强了业务连续性和用户体验。

主要职责:
1、系统设计与架构规划:负责项目的整体设计,包括数据流的规划、监控指标的选择以及日志收集策略的制定。
2、ELK部署与配置:使用Docker-compoes编写Dockerfile来对Elasticsearch, Logstash, 和Kibana进行容器化部署,确保系统的高可用性和扩展性
3、Prometheus监控与Grafana可视化:部署Prometheus作为监控系统,收集和存储时间序列数据。利用Grafana构建监控仪表板,实时展示系统和应用程序的健康状况。
4、Filebeat集成:配置Filebeat作为轻量级日志收集器,从多个源(包括容器、服务器和应用程序)收集日志文件,传输到 Logstash 进行进一步处理。
5、报警系统配置:利用Prometheus /Alertmanager和Grafana的报警功能,实现了对关键指标异常的即时通知。
6、性能调优与问题解决:监控 ELK和Prometheus的运行性能,调整配置以优化数据处理速度和查询响应时间。

项目二:十米游戏服务端华为云迁移
技术栈:Docker Docke-compoes Zookeeper Redis Mysql Nginx
项目介绍:随着后续第三方融云、纳晶云接入逐步上线,国内服务端资源慢慢吃紧,需要进行正式服服务端迁移与扩容, 该项目的目标是利用华为云的高性能计算和可扩展性,以支持我们不断增长的用户基础和提高服务稳定性。 迁移完成后,新的正式服并发处理能力提升3倍,阿里云资源将会退费释放。
主要职责:
1、迁移和回退策略规划:制定详细的迁移计划和回退方案,包括服务的逐步迁移、数据迁移、以及确保迁移过程中服务的连续性和数据的一致性。
2、环境搭建与配置:在华为云上搭建新的生产环境,使用自动化部署基础设施,包括配置 VPC、安全组、ECS 实例
3、服务容器化与编排:将游戏服务端应用及其依赖的中间件(如 Zookeeper、Redis)容器化,并使用Docker-compoes进行部署和管理,便于服务可扩展性。
4、数据迁移与同步:做好备份执行MySQL数据库迁移,利用 Redis 的数据复制特性同步实时数据,同时保证Zookeeper集群的状态一致性和数据的无缝迁移。
5、负载均衡与网络优化:配置Nginx作为反向代理和负载均衡器,优化网络配置以提高应用的响应速度和处理能力。
6、性能测试与优化:在迁移完成后执行压力测试,评估系统性能,并根据测试结果调整和优化系统配置,确保满足生产环境的性能需求。

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服