常见的cv算法以及
包含文档智能ocr系列 人脸识别系列 图像质量防伪系列 图搜相似检索系列 图像翻译生成系列
常见的nlp算法以及
文本关键信息抽取 文本总结 文本相似检索 文本生成 小语种文本理解
常见的多模态算法
比如clip blip等
某大厂人脸识别项目优化
主要负责人脸识别口罩遮挡影响下的人脸比对和识别优化,包括人脸质量,检测,表征对比学习
某大厂东南亚小语种ocr项目:
承接集团内国内各种证件,文档的ocr和nlp理解项目30余项。另外负责小语种ocr和nlp理解能力打造
识别图搜query图像的小语种文本,对小语种文本进行适当处理后,运用到图搜召回中。主要包含了泰语,越南文的ocr识别已经泰语越南文等多语种文本表征对比学习
角色 | 职位 |
负责人 | 多模态算法工程师 |
队员 | 后端工程师 |
检测和识别商品图像中的文本,包含多国语言,识别出结果后,训练相似文本检索应用到搜索链路中。检测和识别商品图像中的文本,包含多国语言,识别出结果后,训练相似文本检索应用到搜索链路中。包含ocr能力和nlp文本检索能力。
从训练数据、训练方法、测试增强三个方面开展工作。针对训练集和测试集差异较大的问题,引入了多种数据增强如降低分辨率、加入高斯模糊、运动模糊、对图片进行平移等方法。特别针对戴口罩人脸识别问题,引入一种简单的口罩增强方法,能够在训练过程中临时快速地对图片加入预设的口罩模板。实践表明,该
从训练数据、训练方法、测试增强三个方面开展工作。该方法使用IResNet-100作为特征提取器,采用两阶段训练。在第一阶段使用 CosFace 进行训练加速收敛,在第二阶段则采用 DCQ + CosFace 联合训练提升识别效果。在测试阶段,该方法采用常见的多图融合方法,对输入图