1. 精通传统机器学习/深度学习(CNN/RNN)模型及应用,精通自然语言大模型(LLM/GLM)的实现、及训练微调等技术,熟练使用p-tuning(v2)、LoRA等微调框架,精通LangChain等大模型应用框架及其源码,熟悉Instruct GPT、记忆还原等防灾难性遗忘技术,熟悉模型迁移(GPU to NPU)、融合算子、并行加速(megatron/DeepSpeed)等大模型迁移调优技术。主导企业级AI使能平台的设计和开发;
2. 精通微服务架构设计,精通系统高可用、高并发处理,精通主流开发平台(Spring boot、Spring cloud等),主导过多款企业级平台设计开发,并实现单服务支撑10000 QPS;
3. 精通大数据平台架构设计,熟悉Lambda、Kappa等架构设计理念,熟悉数仓和Kimball维度建模,有10亿级数据“监管维”平台的设计开发经验;
4. 精通领域建模、整洁架构,精通代码及设计的优化重构,精通软件设计相关方法论及实践,担任部门软件设计训练营讲师及软件教练,带领软件特战队完成部门所有工具的代码梳理和重构方案设计;
5. 精通离散事件仿真内核设计,精通各种仿真应用设计开发(道路交通仿真、网络仿真、船舶港口仿真等),精通开源仿真平台JIST/SWANS、及其应用开发,具备开源JIST/SWANS二次开发能力,且完成其服务化改造;
项目经验
1. 企业级AI模型自动化推训平台,包含资源纳管及调度、AI模型管理、语料管理、自动化推理训练流水线等;
2. 多个AI模型训练开发,包含领域大模型训练微调、物体检测/分割、万卡级模型并行策略优化等;
3. 企业级混合云平台,包含常见资源纳管、管理、计量计费等;
4. 企业级知识图谱应用,包含知识采集、数据处理、知识提取、知识融合、知识加工、知识存储、知识检索、智能体应用等;
角色 | 职位 |
负责人 | 技术专家 |
队员 | 产品经理 |
队员 | UI设计师 |
队员 | 前端工程师 |
队员 | 后端工程师 |
基于lstm和attention机制,实现rnn序列模型,完成日期格式自动转换能力开发,识别准确率高
实现cnn模型,主要应用场景为识别图像中物体轮廓,并用不同颜色填充,实现图像物体的检测分割能力,识别准确度百分之百