针对传统方法对驾驶证识别效果较差的问题,本文设计了一种基于深度学习的驾驶证OCR系统。由于设备和外部环境的影响,设备拍照所得的驾驶证图像存在倾斜、光照不均匀等问题,严重影响识别效果。本文通过对图像进行图像增强、倾斜校正、红章定位、字符分割等方法进行驾驶证的前期处理,再用CRNN模型对提取的文字区域进行识别。实验结果表明,本文实现的识别系统能够达到较好的识别效果,证实了其有效性。
文字识别部分方法众多,上世纪70年代末,我国最初的印刷体汉字识别研究刚刚起步,主要通过模板匹配的方法。简而言之,模板匹配就是通过一些方法提取待识别文本的图像特征,逐一与特征库中字符特征进行比对,得到最终的识别结果。但是随着汉字字体越来越多,每一种字体所具有的结构特征和统计特征都有区别,特征库不可能全部包含,这就是模板匹配方法难以打破的瓶颈。欧式空间比对法就是特征匹配的常用算法之一,比较常用的还有:松弛比对法、动态程序比对法、HMM(Hiddne Markov Model)法等等。直到2012年深度学习因AlexNet网络的出现进入爆发期,大大推进了OCR技术的发展,此后OCR识别领域逐渐由深度学习取代特征匹配,目前深度学习的OCR主要以CNN+RNN+CTC[5]、CNN+RNN+Attention为主流的识别模型。