✓ 熟练掌握 Golang,具有丰富的项目化工程经验,熟悉 Python 开发;
✓ 具有 AI 训练平台系统架构设计和开发经验;
✓ 熟悉微服务架构设计以及 DDD,具有高可用和高并发架构设计项目经验;
✓ 熟悉 Docker/K8S/Istio,具有云原生开发经验;
✓ 熟悉大数据组件 Hadoop/Hive/Spark,具有数据分析相关项目经验;
✓ 熟悉性能瓶颈分析与调优,具有性能优化经验,具有扎实的操作系统、计算机体系结构等基础理论;
✓ 熟悉 Mysql/Redis/Kafka/Etcd 等中间件,Prometheus/ELK/Skywalking 等可观测组件;
✓ 了解 TCP/IP 协议栈以及网络编程原理;
➢ NLP 训练平台设计与开发(gin/gorm/ddd/kafka/k8s/gRPC/API Gateway/DW/Spark)
项目描述:实现对算法模型训练/发布/在线测试等流程,模型训练支持多人协同编辑以及离线训练,
模型发布支持灰度发布以及 AB 测试,满足服务高可用支持高并发,保证数据最终一致性。
主要工作:负责 AI 平台整体架构设计与研发,包括网关服务/数据仓库/分布式调度服务以及 k8s 改造;
1. 负责设计和开发网关服务,具备路由转发、API 监控、鉴权、负载均衡、服务发现、健康检查、
熔断降级等服务治理功能;
2. 负责设计和开发分布式调度服务,基于 kafka 实现消息队列、超时重试、故障转移、任务依赖等
功能;
3. 负责设计和开发数据仓库,基于 ddd 和接口开发思想,实现数据采集、数据传、ETL 和数据生命
周期管理等,支持批处理;
4. 负责设计和实现基于 k8s 改造,主要基于 qps/cpu/memory 等对服务动态扩缩容,基于 configMap
和 Inotify 机制对配置进行热更新等等;
5. 负责设计与开发话术挖掘、话术监控、模型标注、聚类插件等业务服务
➢ SAAS 多租户系统设计(gin/gorm/ddd/RBAC/OAuth2)
项目描述:bot 机器人迁移至公有云,为保障客户的数据隔离,多租户平台对客户提供 API 以及 SDK
能力,通过 API 管理实现按流量和租期收费。
主要工作:
1. 负责设计和开发 API 管理模块,基于 AppKey 和 AppSecret 实现 API 绑定、API 授权以及访问控
➢ 负责性能分析工具设计与开发(Golang, SQL, RPC)
项目描述:产品基于微内核架构设计,数据采集模块以插件形式进行扩展。客户端采集器采集性能指
标经 GRPC 传输到服务端的持久层进行存储,服务端调用分析器对性能指标分析并给出调优建议。其
中采集器与分析器均以插件形式注册到服务,支持高并发指标采集与性能分析。
主要工作:负责分析器调度框架/持久层/插件设计与开发工作,提高软件性能分析效率 200%。
➢ 负责二代基因测序软件 GATK 性能优化(C/C++, Java, Spark)
项目描述:为提升 ARM 服务器竞争力,针对 HPC 领域热门基因测序软件进行性能优化,主要目标实
现测序时间优于同级别 X86 服务器,并验证性能分析工具的可行性。
主要工作:主要负责分析性能瓶颈,通过 Spark 提高并发能力,软件预取提高 cache 命中率,NEON
汇编指令优化 Smith-Watterman 序列对比算法,Bcache 缓存方案等优化手段, 整体性能提升 150%。
➢ 负责 5G 云核心网 PCF 网元消息跟踪设计与开发(Golang, C, k8s, Docker)
项目描述:5G 核心网实现微服务化及云化的演进,开发消息跟踪功能有利于分析定位,跟踪不同网
元之间的信令交互,通过 TraceID 实时跟踪信令,并实时展示在页面。
主要工作:主要负责 PCF 网元之间的消息跟踪设计与开发,对现网问题定位效率提高 100%。