猿急送>

深圳Python兼职程序员

ID：218629

疾风亦有归途

开发工程师（Java，Python）

公司信息：
中国广核集团

工作经验：
3年

兼职日薪：
500元/8小时

兼职时间：
下班后
周六
周日

所在区域：
深圳
福田

技术能力

java(spring MVC,spring boot ,mybatis, mysql)
python(图像处理，识别，目标检测，人体姿态估计)
安卓开发（java/kotlin）
服务器(windows server，centos/Ubuntu) dokcer
ASR/TTS，语音驱动人物口型

项目经验

因合合引擎不包含海关税票的识别，接到领导命令开发税票的识别服务，此服务为中广核票据识别中的一类票据（海关关税票据）识别服务，本人负责开发海关税票识别服务器供中广核财务共享中心OCR影像识别系统调用服务进行识别。

数据训练集：1K-3K
1.算法/框架：YOLO V3-keras,torch-CRNN，CTC，VGG，
2.开发语言：python。开发工具：pycharm,imagelabel
3:cuda 10,cudnn 7.X
4:标注好的数据在yolo v3 keras版本下，结合chineseocr场景文本检测权重文件，在此基础上进行预训练，损失值达到一定程度后冻结文件，完成检测模型进行预测。标注工具：imagelabel
5:在rcnn下进行中英文识别预训练，去掉最后一层权重，预测，评估，冻结，或使用其他算法下的识别模型（chineseocr下的识别模型/AttentionOCR下的识别模型，查询模型的输入输出节点信息）
6:使用VGG开源的文字方向检测，集成到项目中
7:集成：yolo v3-keras,crnn,ctc,vgg
● 封装接口后训练集外测试300张识别准确率达到百分之92以上，CPU下因服务器性能原因，每张识别速度在5-6秒间

这个项目是将中广核电子发票（PDF/OFD）进行转换图像，OFD解析，保存至数据库，便于结构化输出。
1.开发语言Java，工具：idea，数据库：mysql
2.Spring boot ,mybatis
3.PDF/OFD组件集成
4.定时向中广核财务共享中心系统抓取电子发票进行图像转换解析，图像保存至服务器，数据记录到数据库，供OCR识别系统获取电子发票信息

中广核财务共享中心各类发票数据，验伪，过期，流程状态等进行大数据展示。
●Java（spring boot mybatis）从其他系统定时获取数据保存至数据库（mysql）
● mysql 每晚定时计算（多表多复杂条件查询，包含数学计算，统计，日期计算，特殊截取，去重，归类等）数据保存至视图，多时千万条数据，少时几十万条数据
● softhubBI(日本的一个BI工具)

这个项目是中广核集团资产审查服务，包含了后台系统，前端管理化界面，移动端。我主要负责移动端拍摄资产上传到后台进行处理的资产识别，分类服务。资产管理系统调用识别分类服务。
1.开发语言：python，开发工具：pycharm
2.crnn下进行文字OCR
3.tensorflow（1.4.X）下进行图像实物识别
4.全文识别中加入条形码/二维码识别
5.部署到Windows服务器，封装成相应的实物识别分类接口，文本/二维码/条形码识别接口

案例展示

深圳海关税票识别

基于不同发票的版式，有些ocr引擎不能满足深圳海关税票识别，基于定制样式发票的OCR识别，采用http形式接受前端传入的发票图像，返回json格式的识别信息
3D数字人交互，本地大模型

3D数字人实时交互提供全流程程序（语音识别，大模型+本地知识库，语音合成，表情/动作驱动）表情口型为ARKIT骨骼标准，UE/unity均可驱动本地大模型部署，各类开源大模型本地部署+知识库，文生图模型，视觉识别模型本地部署