对传统视觉算法有一定研究,有应用经历。
对新兴深度学习为基础的视觉算法有一定理解。
主要研究领域是目标检测。从CRNN系列到最新的achor free目标检测器的原理基本理解,能针对场景需要进行灵活修改。
能熟练使用C++编程。有过嵌入式软件开发经验,对提高程序运行性能有很深的认识。
yolo系列的算法复现工作,参照论文从0复现算法。
独立完成过一个项目的算法改进、模型训练、C++部署。熟练使用pytorch、libtorch、tensorRT这一套开发套件。
用人工智能和传统算法修复视频上的缺失部分。比如移除视频中物体、去除视频上文字和图标、移除水印等等。 此项目为本人独立完成,经历了算法的选取、对比实验、算法优化、算法部署加速、C++部署、tensorRT调试等等一系列过程。历时三个月独立完成。效果和速度达到了业界领先水平。
检测出工业加工零件上的文字和每个字符的精准位置。 此项目有两大难点,第一、金属材料上的镂刻字符颜色单一,线条简单,这就导致特征很少,训练很难收敛。第二、现有OCR算法都是以字符串为目标识别字符,只能做到定位一串字符位置的效果,而此项目需要定位每个单字符的位置。