熟练掌握图像处理图像识别技术,对OCR技术拥有多年工作经验,熟悉Tensorflow,Pytorch以及Caffe框架,熟练使用Python和C++编程语言,对文本行定位算法如CTPN,EAST以及PSENet等以及文子识别算法如CRNN,ASTER等算法有深入了解,同时对目标检测领域也有一定的了解,熟悉Faster RCNN,Mask RCNN,CenterNet以及Yolov3, SSD等目标检测算法;熟悉深度学习以及机器学习技术,并对传统图像处理模式识别也有深入的研究,曾主导过多个大型OCR识别系统,参与研发公司OCR核心算法如文本行检测算法和文本行识别算法。
发票识别系统:由本人主导,从架构设计,项目规划以及具体算法实施,实现了从0到1的过程,本系统采用了多种图像处理以及图像识别算法,采用传统图像处理+深度学习图像识别算法,对任意角度的扫描件以及拍照件发票采用:裁切旋转矫正+图像增强+图像分类+文本行定位+文本行识别+结构化后处理的流程进行OCR发票识别。目前关键字段的识别率达到99%左右,应用于各大财务机构中。
车辆识别码(VIN)识别系统:由本人设计主导开发,主要负责VIN码定位模块的训练和调优,以及整个系统的设计开发,目前该系统的准确率远优于市面上现有的系统,相比阿里以及腾讯优图的VIN在识别率上很大的优势。采用了以CTPN和CRNN技术作为baseline,在此基础上进行模型网络结构重构,重新训练模型并调参。