有7年的深度学习方面的工作经验,主要工作内容包括移动端算法移植 (Paddle-Lite框架:移植了分割、检测和分类模型),tensorRT模型优化加速,基于深度学习的目标检测和分割及字符识别算法,能够熟练运用PyTorch和Caffe深度学习框架,能快速上手其他深度学习框架。熟悉Linux平台,熟练运用docker和Anaconda等工具,熟悉Git、CMake编译等。
1. tensorRT模型优化加速
主要工作:公司算法后台引擎中的检测和分类模型为主要耗时部分,为提升算法后台效率,用tensorRT优化加速分类模型,以降低算法后台整体耗时。研究tensorRT的int8精度优化加速。
主要职责:用tensorRT加速分类模型并部署到算法后台,测试稳定性。
结果:将tensorRT运用到算法后台加速中,提升算法后台处理效率。
收获:熟悉tensorRT的优化和部署,研究了tensorRT的int8精度优化加速。
2. Paddle-Lite移动端模型移植
主要工作:用Paddle-Lite框架将deeplab_v3分割模型、mobileNet_v2_ssd检测模型和场景分类模型成功移植至移动端。
主要职责:将PyTorch模型转换成onnx模型,再用x2paddle和opt工具将onnx模型转换为Paddle-Lite模型,最后将分割、检测和分类模型移植至移动端。
结果:在移动端能够成功运行分割、检测和分类模型。
收获:熟悉移动端移植过程,解决模型转换和移植过程中遇到的相关问题。
算法后台引擎中的检测和分类模型为主要耗时部分,为提升算法后台效率,用tensorRT优化加速分类模型,以降低算法后台整体耗时。研究tensorRT的int8精度优化加速。
用Paddle-Lite框架将deeplab_v3分割模型、mobileNet_v2_ssd检测模型和场景分类模型成功移植至移动端。