使用过一些常用的神经网络,了解tensorflow、pytorch深度学习框架,熟悉CNN、RNN等主流深度学习算法,具备基本的实际使用和调试技巧。对于OCR检测方面较为熟悉,OCR识别方面有所接触。
1. 对于模型压缩任务自己完成过整套工具,在多个任务中分别压缩至50%,30%,25%效果无损失;
2. OCR多项目任务中完成检测任务
1. 银行卡识别
拍摄公司内部银行卡,制作数据,利用 ctpn 做检测,crnn 做识别,识别结果返回给银行卡的结构化类通过正则返回前端页面。(项目占比:80%)同时,进行各单一场景下的结构化信息匹配,从而完成定制场景开发。
2. 集装箱识别
首先利用真实集装箱数据标注集装箱号位置信息,然后进行数据增强,从而进行 PSENet 训练,得到检测模型;在识别方面,提取 ROI 区域并写入txt,保存 label,数据增强后创建 LMDB 数据集,使用 attention 在预训练模型基础上进行 finetune 得到集装箱号的识别模型。
3. 表格识别
1.0版本:(传统算法)分析图片进行去印章处理,寻找表格轮廓进行图像分割,分别对文本部分和表格部分进行处理;文本部分通过 PSE 与 CRNN 进行识别;表格识别利用轮廓寻找到 cell,进行 crnn 识别。
2.0版本:(深度学习)首先进行文字四分类方向检测,然后采用 Unet 网络进行表格线的语义分割和提取,分割出表格、非表格区域,识别返回结果。
4. 其余各个任务
表格识别 1.0版本:(传统算法)分析图片进行去印章处理,寻找表格轮廓进行图像分割,分别对文本部分和表格部分进行处理;文本部分通过 PSE 与 CRNN 进行识别;表格识别利用轮廓寻找到 cell,进行 crnn 识别。 2.0版本:(深度学习)首先进行文字四分类方向
三、相机标定 1. 相机标定的目的 获得相机的内参和外参矩阵(同时也会得到每一幅标定图像的旋转和平移矩阵),内参和外参系数可以对之后相机拍摄的图像进行矫正,得到畸变很小的图像。 2. 相机标定的输入 标定图像上所有内角点的图像坐标,标定板图像上所有内角点的空间三维坐标
三、相机标定 1. 相机标定的目的 获得相机的内参和外参矩阵(同时也会得到每一幅标定图像的旋转和平移矩阵),内参和外参系数可以对之后相机拍摄的图像进行矫正,得到畸变很小的图像。 2. 相机标定的输入 标定图像上所有内角点的图像坐标,标定板图像上所有内角点的空间三维坐标