数学功底扎实,良好的数理统计、统计学习与数学建模基础;
熟悉 Python、MATLAB等编程语言,掌握基本的C++编程;
熟悉各个主流CNN分类及目标检测、跟踪算法;
掌握Caffe、Matconvnet、PyTorch、TensorFlow和Darknet等深度学习框架使用方法;
熟悉Caffe和Matconvnet的框架运行机制,可以基于C++编写新的神经网络层;
熟练使用Linux操作系统,熟悉基本的shell脚本编写;
熟练使用Latex、Visio、PowerPoint、Excel等软件,可以熟练的进行英文写作;
1.基于低复杂度机器视觉算法以及低速无线数据链的图像识别技术演示模块
针对使用GPU进行深度模型训练代价高的问题,实现摄像模组完成图像采集,通过接口与FPGA相连,在上位机控制下,支持图像识别技术的FPGA(KC705)对物体进行识别跟踪,同时记录识别目标的轨迹和个数,并存储相关视频流于上位机,同时开发一个实时的手势识别演示功能。
2.基于深度学习的字符识别算法集成框架
主流深度学习字符识别算法如Aster和CRNN算法,它们在深度学习框架、模型训练细节、特征主干网络、优化算法和训练数据集等方面存在着不同。在算法落地过程中有必要考虑不同中算法的性能,包括精度和速度。基于目前开源的算法,设计一套统一的框架方便不同字符识别算法的公平比较,给实际的生产活动做参考。
3.LCM单/多相机手机屏幕瑕疵检测
利用计算机视觉技术在生产线上对手机屏幕瑕疵进行检测,实现了生产线上识别瑕疵的自动化。算法的输入为生产线上相机实时拍摄的手机屏幕图片,输出为屏幕有无缺陷以及缺陷的种类和位置。
功能: 基于计算机视觉的移动行人监控系统。通过操控搭载了监控摄像头的移动小车,实现监控区域的自由切换。另外,融合深度卷积神经网络和高斯核化相关滤波器,实现了对监控画面中单个行人的自主识别、定位与跟踪。 角色: 检测和跟踪算法设计
功能: 主流深度学习字符识别算法如Aster和CRNN算法,它们在深度学习框架、模型训练细节、特征主干网络、优化算法和训练数据集等方面存在着不同。在算法落地过程中有必要考虑不同中算法的性能,包括精度和速度。基于目前开源的算法,设计一套统一的框架方便不同字符识别算法的公平比较,给