ID:319271

心想事成的小薛

算法工程师

  • 公司信息:
  • 北京虾皮信息科技有限公司(Shopee)
  • 工作经验:
  • 2年
  • 兼职日薪:
  • 600元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 北京
  • 海淀

技术能力

编程语言:python
深度学习:熟悉分类、检测、分割等领域的主流算法,熟悉pytorch、mxnet训练框架,熟悉算法调研->数据准备->模型训练->模型评估->模型发布->模型部署等完整流程
性能优化:熟悉onnx、tensorrt、triton等推理部署开发工具
常用库:openmmlab、paddledet、opencv等
软技能:具备较强的分析解决实际问题的能力以及良好的沟通、学习和协作能力

项目经验

异源路网结点相似度计算
1. 基于规则的结点相似度计算只考虑与结点直接关联的信息,泛化性较差;基于图神经网络的结点相似度计算只考虑了结构相似性而丢失了空间信息;基于图像分类模型可以综合考虑结点的结构和空间位置信息,此外,鉴于传统CNN模型捕捉全局信息能力较差,而结点相似度计算需要建模长距离的依赖关系,因此选择vit模型,accuracy从90%提高至96.1%
2. 鉴于输入图片的通道为异源路网信息,其各通道重要性并不相同,通过添加通道注意力机制,accuracy从96.1%提高至96.5%
3. 鉴于正负样本分布不均衡的问题,通过动态采样、focal loss等方式将accuracy提高至97%,最终帮助线匹配accuracy从85%提高到91%

车牌识别算法落地
背景:丰富算法组人工智能平台的应用能力
1. 传统车牌识别需要预先将车牌中的字符分割、然后再对分割出的字符进行分类,鲁棒性较差,因此选用LPRNet
2. 鉴于实际场景下的车牌存在多种的形变情况,通过在LPRNet中加入STN模块,accuracy从92%提高到92.7%
3. 鉴于实际场景中多存在双行车牌的情况,通过将LPRNet分层并将上下层拼接以进行最后预测使其自适应单双行车牌识别,accuracy从92.7%提高到93.6%

表格重建算法落地
1. 目前业内表格重建解决方案主要分为1)基于分割网络提取表格线然后构建单元格 2)基于端到端的生成html/xml序列 这两种方案,而html/xml序列方案基于大量的表格数据,且目前主要为英文场景下的数据集,难以迁移到中文场景、中文识别率低,遂采用分割方案(基于unet模型)
2. 鉴于单元格合并频率较高而通过表格线之间的关系生成规则的方法较为复杂难以覆盖所有合并的情况,遂在常见场景下表格线提取准确率为99%的基础上应用轮廓提取方案以获得表格单元格坐标
3. 鉴于单元格内无字区域较多且常有多行文本现象而传统opencv方案鲁棒性较差,遂采用文字检测坐标与单元格坐标匹配方案提高了单元格内容accuracy15%

身份证信息识别算法落地
1. 独立解决图片中身份证位置不固定影响的文字识别准确率不高的问题,通过正倒分类、倾斜矫正等使文字识别accuracy提高5%
2. 参与解决图片质量不佳、模型误差导致的文字识别率下降问题,通过利用监督信息对结果校正,使文字识别accuracy提高4%
3. 参与解决身份证数据被水印污染的问题,通过加入gan网络去水印将文字检测mAP提高了3.7%

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服