语言:Python, C++, Matlab, Java, Shell, Lua, cuda-c等
工具:Tensorflow,Pytorch,Opencv,Flask等
主要方向:计算机视觉/图像识别(OCR,目标检测,语义分割,文档处理), GAN,SR,模型压缩优化等
涉及兴趣:人脸识别,自然语言处理(命名实体识别),语音处理(TTS),文本挖掘,以太坊
能力特长:快速选用效果、效率最佳算法实现并针对项目改进并落地。对数据不足的所需的数据增强、脏数据过多的数据清洗、模型参数调优等有自己的理解与工程化经验。
一、文档OCR识别服务
识别提供的文档文件(拍照图片、扫描图片、PDF等形式),包括
①预处理过程: 倾斜矫正、去印章、去噪等等
②内容提取及识别:使用最新基于深度学习神经网络的目标检测、文本识别等技术,按类别定位并提取图表、表格、文本行块等并识别。
③后处理:按需求对识别结果处理成所需数据格式,并通过HTTP接口形式对外提供服务。
亮点:最新的图像识别及文档图表结构化技术,结合相应专业数据,比市面上所有通用文档处理系统或AI云平台接口的识别结果都要好,目前已商业使用。
二、验证码识别服务
为爬取网站所需的验证码认证提供破解服务,包括极验及其它自研验证码。 融合利用数字图像处理、基于深度神经网络的OCR技术、语言模型、GAN等技术,实现点击型、滑窗型、问答型、图像分类型等各类验证码,其中一般验证码识别准确率95%以上,极验能达到85%以上,在GPU机器上平均单个验证码破解速度在几十毫秒到几百毫秒,已成功破解包括BOSS直聘、工商信息系统等网站,目前供日均百万以上爬取平台使用。