java(spring MVC,spring boot ,mybatis, mysql)
python(图像处理,识别,目标检测,人体姿态估计)
安卓开发(java/kotlin)
服务器(windows server,centos/Ubuntu) dokcer
ASR/TTS,语音驱动人物口型
因合合引擎不包含海关税票的识别,接到领导命令开发税票的识别服务,此服务为中广核票据识别中的一类票据(海关关税票据)识别服务,本人负责开发海关税票识别服务器供中广核财务共享中心OCR影像识别系统调用服务进行识别。
数据训练集:1K-3K
1.算法/框架:YOLO V3-keras,torch-CRNN,CTC,VGG,
2.开发语言:python。开发工具:pycharm,imagelabel
3:cuda 10,cudnn 7.X
4:标注好的数据在yolo v3 keras版本下,结合chineseocr场景文本检测权重文件,在此基础上进行预训练,损失值达到一定程度后冻结文件,完成检测模型进行预测。标注工具:imagelabel
5:在rcnn下进行中英文识别预训练,去掉最后一层权重,预测,评估,冻结,或使用其他算法下的识别模型(chineseocr下的识别模型/AttentionOCR下的识别模型,查询模型的输入输出节点信息)
6:使用VGG开源的文字方向检测,集成到项目中
7:集成:yolo v3-keras,crnn,ctc,vgg
● 封装接口后训练集外测试300张识别准确率达到百分之92以上,CPU下因服务器性能原因,每张识别速度在5-6秒间
这个项目是将中广核电子发票(PDF/OFD)进行转换图像,OFD解析,保存至数据库,便于结构化输出。
1.开发语言Java,工具:idea,数据库:mysql
2.Spring boot ,mybatis
3.PDF/OFD组件集成
4.定时向中广核财务共享中心系统抓取电子发票进行图像转换解析,图像保存至服务器,数据记录到数据库,供OCR识别系统获取电子发票信息
中广核财务共享中心 各类发票数据,验伪,过期,流程状态等进行大数据展示。
●Java(spring boot mybatis)从其他系统定时获取数据保存至数据库(mysql)
● mysql 每晚定时计算(多表多复杂条件查询,包含数学计算,统计,日期计算,特殊截取,去重,归类等)数据保存至视图,多时千万条数据,少时几十万条数据
● softhubBI(日本的一个BI工具)
这个项目是中广核集团资产审查服务,包含了后台系统,前端管理化界面,移动端。我主要负责移动端拍摄资产上传到后台进行处理的资产识别,分类服务。资产管理系统调用识别分类服务。
1.开发语言:python,开发工具:pycharm
2.crnn下进行文字OCR
3.tensorflow(1.4.X)下进行图像实物识别
4.全文识别中加入条形码/二维码识别
5.部署到Windows服务器,封装成相应的实物识别分类接口,文本/二维码/条形码识别接口
基于不同发票的版式,有些ocr引擎不能满足深圳海关税票识别,基于定制样式发票的OCR识别,采用http形式接受前端传入的发票图像,返回json格式的识别信息
3D数字人实时交互 提供全流程程序(语音识别,大模型+本地知识库,语音合成,表情/动作驱动)表情口型为ARKIT骨骼标准,UE/unity均可驱动 本地大模型部署,各类开源大模型本地部署+知识库,文生图模型,视觉识别模型本地部署