ID:299587

记得

中级NLP算法工程师

  • 公司信息:
  • 北京亚鸿世纪信息科技有限公司
  • 工作经验:
  • 2年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 所在区域:
  • 武汉
  • 全区

技术能力

1、具备良好的爬虫技能,能绕过反爬措施,爬取相应内容
2、良好的编程能力,熟练机器学习、深度学习原理,能做分类、生成、命名实体识别、文本摘要、OCR识别、图像识别等任务
3、熟练运用工具进行分词、词性标注、关键词提取、预训练词向量
4、深度学习开发框架pytorch、tensorflow,熟练应用linux进行开发
5、预训练模型BERT等的微调完成特定任务
6、熟悉逻辑回归、决策树等机器学习算法
7、工作票、合同信息抽取

项目经验

2022.03-至今 安卓APP设诈研判 NLP算法工程师
1、从事app研判工作,采用包名、关键词、图标、源码模板匹配等策略对APP进行研判,目前准确率已经达到96%

2021.11-2021.2022.3 国家电网工作票信息抽取 NLP算法工程师
项目描述:
国家电网福建省电力公司想引进人工智能在设备运维方面的深度应用,达到精细化管理的要求。通过预研变电工作票语义解析,解析出的结果与台账匹配,为财务核算提供真实且标准化的数据。
项目职责:
1. 承担利用深度学习解析工作票的任务,本项目难点将海量的工作票数据进行分类并进行标注,预先定义间隔、设备和动作之间的关系
2. 工作内容:
a) 数据处理,与国网相关人员讨论得到变电工作票的间隔、设备和动作等实体
b) 将工作票进行分类,例如单设备单动作单设备多动作、多设备单动作、多设备多动作等
c) 对传统的BIO系统进行创新,通过添加后缀来反映间隔、设备和动作之间的对应关系,通过手动标注+数据增强标注数据
d) 构建BERT_BiLSTM_CRF模型,将标注好的数据送入模型,进行训练
e) 模型类中添加了relu激活函数,使用masked_CRF替换传统的CRF,优化路径选择
项目业绩:
 标注了108个类别的数据共30000条数据,标签设置295个,训练集24000条,验证集6000条
 标签识别精确率99.45%,标签识别召回率96.70%,台账匹配率95.8%
 从2019年-2021年12月变电工作票中选取与标注类似的100条工作票,识别准确率为94%,随机抽1000条包含各中类型的工作票,共解析出20800条间隔+设备+作业,比例:1:20.8,准确率为90.8%,超过原来团队所采用的传统CRF算法。

2021.07-2021.11 智能外呼 NLP算法工程师
项目描述:
微众银行想做智能外呼机器人,涉及到贷款催收的业务,本公司出了一版模型,表现不太理想。需要进一步提升机器人意图识别、语义理解的表现。
项目职责:
1. 承担外呼模块优化模型表现提升意图识别准确率的任务,本项目难点是在数据量匮乏的情况下提升外呼机器人的意图识别的表现
2. 工作内容:
a) 构建智能外呼多意图识别模型,训练,得到基本的baseline表现
b) 基于baseline表现,总结模型出现过拟合,采用数据增强方法。使用开源模型Simbert相似性语句生成包,在此基础上改写代码生成相似句。
c) 对不同方法进行详细对比,撰写对比结果文档,确定选用的数据增强方法,用增强后的数据集作为训练集,内部人员新标注的数据作为测试集,验证之前的结论
d) 代码的工程化、规范化;将数据增强方法封装成Flask服务,提供API接口,撰写相应接口文档,与测试人员沟通,数据传入的json格式,根据反馈的结果作相应的调整
项目成果:
 相似语句生成方法中随机字符位置替换和simbert较好
 未用数据增强方法时模型验证集的表现时73%,使用随机字符位置替换后模型验证集表现是98%,提升34.2%,测试阶段标签预测准确率为95%;使用simbert后模型验证集现是80%,提升9.6%,测试阶段标签预测准确率为88%
 通过几轮沟通、更改,最终满足上线要求,成功上线。外呼机器人的意图识别能力提升10%

案例展示

  • 聊天机器人

    聊天机器人

    随着人工智能技术的发展, 聊天机器人, 语音助手等应用在生活中随处可见, 比如百度的小度, 阿里的小蜜, 微软的小冰等等. 其目的在于通过人工智能技术让机器像人类一样能够进行智能回复, 解决现实中的各种问题

  • 客服系统

    客服系统

    首先,客服系统由三个部分构成,分别是前端部分,后端部分和AI部分。 前端部分提供两个客户端,一是为普通用户展示和试用API的界面;二是为AI工程师提供模型服务提交和测试监控的界面。 后端部分是连接前端部分和AI部分的重要桥梁,实现除AI功能部分的全部逻辑,如用户请求逻辑,数据

  • 客服系统

    客服系统

    首先,客服系统由三个部分构成,分别是前端部分,后端部分和AI部分。 前端部分提供两个客户端,一是为普通用户展示和试用API的界面;二是为AI工程师提供模型服务提交和测试监控的界面。 后端部分是连接前端部分和AI部分的重要桥梁,实现除AI功能部分的全部逻辑,如用户请求逻辑,数据

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    1
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服