GPU CUDA高性能计算,AI推理模型包括计算机视觉,大模型等推理部署,x86/arm/gpu平台模型推理优化。gpu编译器,如llvm等
neon/avx/cuda等编写,熟悉gpu架构。有过大模型训练的经验。
1. 在公司内部平台优化gpu/x86等平台优化视觉,语音和自然语言,广告推荐模型等,降本2亿,部分模型性能远超TensorRT/openvino等框架;
2. 基于llvm开发支持国产gpu的编译器后端
角色 | 职位 |
负责人 | 高性能计算工程师 |
队员 | 产品经理 |
队员 | 前端工程师 |
队员 | 后端工程师 |
在CPU业务模型性能全方位超越openvino,部分模型超越目前开源最快框架MNN。 全CPU平台主流CNN模型性能均有提升,其中vgg和resnet34在AMD-CPU上性能提升明显,分别提升107%、55.5%。
一种表面肌电信号特征处理与关节角度预测方法及系统,专利已授权 一种穿戴式腕部康复训练柔性传动外骨骼 专利已授权