1.熟悉Python编程
2.从事深度学习模型开发,主要研究方向为计算机视觉,nlp、语音以及大模型,计算机视觉主要做OCR文本识别,目标检测,语义分割,GAN等。nlp主要做命名实体识别,情感分类,关键信息提取,文本相似度匹配等。语音方面主要做语音转文本,文本合成语音等。
3.熟悉docker
4.熟悉后端接口开发,主要使用fastapi以及flask
1.发票识别OCR模型,增值税发票OCR识别模型
全字段识别:支持对普票,专票、全电发票的结构化识别,包括发票基本信息(发票代码、号码、开票日期、校验码、金额)、销售方及购买方信息、商品信息、价税信息等全部关键字段;
二维码识别校验:识别票面左上角的二维码,获取发票代码、号码、金额、开票日期、校验码五个字段信息,与识别到的对应字段信息进行匹配校验,保证更高的识别准确率;
识别结果可输出为Excel表格。
2.表格识别模型,表格OCR识别,支持有线表格识别,支持单元格合并的表格,支持图片方向矫正,可实现单个字符坐标的解析,可将识别结果倒入到Excel中,以及生成html表格。
3.人脸识别能力,基于mysql、milvus、minio、insightface等搭建的人脸识别能力,支持人脸检测、人脸特征提取、人脸1:1比对、人脸搜索(1:n比对)。
4.可提供发票识别、表格识别、身份证识别、火车票识别、航空行程单识别、印章识别、车牌识别、通用文档识别等。
表格OCR识别,支持有线表格识别,支持单元格合并的表格,支持图片方向矫正,可实现单个字符坐标的解析,可将识别结果倒入到Excel中,以及生成html表格。
1.发票识别OCR模型,增值税发票OCR识别模型 全字段识别:支持对普票,专票、全电发票的结构化识别,包括发票基本信息(发票代码、号码、开票日期、校验码、金额)、销售方及购买方信息、商品信息、价税信息等全部关键字段; 二维码识别校验:识别票面左上角的二维码,获取发票代码、号码
人脸识别能力,基于mysql、milvus、minio、insightface等搭建的人脸识别能力,支持人脸检测、人脸特征提取、人脸1:1比对、人脸搜索(1:n比对)。