ID:347730

HPC 高级运维工程师

高级技术支持工程师

  • 公司信息:
  • 深圳北鲲云计算有限公司
  • 工作经验:
  • 5年
  • 兼职日薪:
  • 1000元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 深圳
  • 宝安

技术能力

- 熟悉路由器及交换机等网络设备的基础配置、包括各大云厂商的专有网络VPC建设;
- 熟悉Linux系统的维护环境,堡垒机搭建和使用,配置安全组和防火墙及用户权限,优化系统安全机制;
- 熟悉Shell脚本,能够编写运维脚本监控服务器的相关信息,进行自动化运维;
- 熟悉高可用及负载均衡原理,以及Nginx的反向代理、负载均衡等相关技能;
- 熟悉Mysql数据库的增删改查、读写分离、MHA集群搭建及维护;
- 熟悉Tomcat、Nginx、Apache、 Node.js等开源软件,能够部署LNMP、LAMP集群及调优;
- 熟悉JenKins持续集成及版本控制工具GIT、SVN、GitLab的原理及搭建,构建CI/CD自动部署;
- 熟悉Ansible常用模块和Playbook进行自动化运维,批量程序部署、批量管理及配置;
- 熟悉KVM自定义虚拟设备及管理,Docker容器自定义镜像及仓库和Dockerfile部署与应用;
- 熟悉Zabbix监控原理及架构搭建和维护大型集群监控平台;
- 熟悉分布式开源调度平台XXL-JOB项目,构建周期计划任务调度可视化,钉钉及时报警功能;
- 熟悉阿里云、腾讯云、百度云、华为云、AWS、Oracle、Azure、Google 的使用和管理;
- 熟悉ELK日志分析平台,ES、Kibana、Logstach的部署及Filebeat的使用;
- 熟悉GlusterFS、Luster 分布式并行文件系统的管理和维护并搭建过以 InfiniBand 网络的大型并行文件系统集群;
- 熟悉Slurm 作业调度系统安装、更新、维护及使用,并搭建维护多个超一万核心的大型HPC 私有化集群项目;
- 熟悉Spack、Easybuild 自动化安装、构建软件框架,能够顺利安装不同版本的foss,Intel 编译工具链软件;
- 熟悉HPC Packer 自动化构建工具,自动化构建多个云厂商 HPC 集群镜像;

项目经验

**项目一、**

**项目名称:使用 Jenkins+GitLab+Ansible 实现 CI/CD 持续集成以及自动发布代码**

**项目描述:**

因公司的产品会不定期更新,为了节约项目集成的时间,透明化构建过程,井然有序的运行脚本,实现持续集成和自动化部署,开发部门的各程序员将写好的代码推送到Gitlab仓库,Jenkins服务器将Gitlab中代码拉去下来进行构建,通过Ansible自动运维工具在需要部署代码的服务器上运行已经提前写好的Python脚本,将Jenkins服务器上构建完成的代码部署到相应文件夹内,发版完成。

**项目职责:**

1.部署Jenkins,GitLab服务器并且用Ansible 模块配置相应服务使其能实现自动化持续集成功能。

2.测试运行效果达到预期后投入生产环境中

**项目二、**

**项目名称:亚马逊云Auto Scaling+ELB+EC2+EFS高可用弹性伸缩项目**

**项目描述:**

​ 因公司的游戏项目推出上线,PV量不持续稳定,为更好的节约计算资源、优化项目成本,搭建亚马逊云Auto Scaling高可用架构配合云厂商负载均衡ELB组件,制作自定义启动模板、AMI再加上多线路CDN,有效的防护黑客攻击,降低游戏延迟,给玩家带来了极好的游戏体验。

**项目职责:**

1. 负责AMI和启动模板的更新和维护及Auto Scaling组和EFS的构建
2. 负责XXL-JOB项目的周期计划任务调度平台的管理和维护
3. 负责多线路CDN、CloudFront及多域名多证书和阿里云OSS对象储存的定时更新及管理
4. 负责亚马逊、阿里云、腾讯云、华为云、百度云专有网络VPC的基础建设及云服务器的安全和审计管理

**项目三、**

**项目名称:大客户售后一线运维**

**项目描述:**

腾讯集团倾力打造的云计算品牌,业务范围覆盖金融、互联网、教育、政府机构等多个行业类型,基于各行业业务特性,为客户提供咨询服务和定制化云计算解决方案,满足政府、企业对信息化和数字化的要求,腾云悦智科技有限公司,是为加速发力B端市场而发起投资成立的公司,专注为旗下多个产品提供技术支撑服务

**项目职责:**

1. 负责基于售后QQ群、企业微信群录单的形式,解决客户在使用腾讯云产品的同时遇到的各种咨询及技术问题;
2. 负责收集用户侧的报错信息及需求,通过平台工具进行初步排查及定位故障原因,给出解决方案及建议;
3. 通过电话/远程/等方式与客户紧密交流,彻底了解客户需求及建议,进行整合,内部推进及解决;

**项目四、**

**项目名称:HPC 超算平台技术支持**

**项目描述:**

​ 专注于为高性能计算行业提供一站式Cloud-HPC产品和服务,于2019年3月进入中国大陆市场,自主研发的云超算平台,主要应用于生命科学、人工智能、芯片设计、高科技制造、CAE/CFD、大气海洋环境、天文地球物理、影视与动漫制作、高性能计算超级计算机等领域,已成功服务中国数千家企业、研究所及高校。

**项目职责:**

1. 负责技术支持团队的绩效考核、7X24小时排班、任务分配,项目推进及进度汇报,维护客户关系及技术支撑。
2. 负责多个私有化项目实施交付、线上SAAS平台运维,多个云厂商账号管理和运维、多个项目用户手册编写和培训交付。
3. 负责多个产品线售后工作,不定期出差拜访客户,配合铁三角,做好项目售前、售中、售后工作。

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服