ID:194362

Yamada

高级算法工程师

  • 公司信息:
  • 携程旅行
  • 工作经验:
  • 3年
  • 兼职日薪:
  • 1500元/8小时
  • 兼职时间:
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 北京
  • 海淀

技术能力

语言:python/java
掌握:常见的机器学习算法和nlp算法,NLP应用算法(seq2seq/attention/transformer)以及语言模型(elmo/gpt/bert)。数据库(Jena/Gstore/Janusgraph/Titan)和语言(shacl/rdf/rdfs/owl/sparql/gremlin)以及图谱推理(owl推理/shacl推理)、 graph embedding(TransX系列)、三元组抽取(DeepDive)、事理图谱。

项目经验

携程旅游知识图谱平台搭建

该项目主要搭建携程的旅游知识图谱,作为携程智能客服和携程产品录入检测的后台存储。项目主要针对非结构化数据采用Joint Model抽取三元组,将抽取出的三元组采用transR完成实体对齐,然后转换成graph格式存储在图数据库(Janusgraph),最后采用shacl推理完成shema一致性验证。

短文本内容风控

该项目主要针对短文本进行色情内容识别,每天监控短文本内容超过5kw+,主要分为两种策略进行识别,分别是分类和匹配:
(1) 分类,基准模型采用textcnn,加入了一些batch-normal、highwork等一些小trcik,线上识别准确率90%以上。
(2) 匹配,采用的是compare-aggregate结构,自己设计的模型,分为三层,编码层采用bilstm+self-attention,compare层采用soft-attention层,最后的aggregat层采用多层卷积。线上识别准确率90%以上。

案例展示

  • 旅游知识图谱

    旅游知识图谱

    其他NLP工作:分词、句法分析、命名实体识别、文本相似度计算、提取关键词、文本分类、对话系统及模型的优化和维护。

  • 旅游知识图谱

    旅游知识图谱

    该项目主要搭建携程的旅游知识图谱,作为携程智能客服和携程产品录入检测的后台存储。项目主要针对非结构化数据采用Joint Model抽取三元组,将抽取出的三元组采用transR完成实体对齐,然后转换成graph格式存储在图数据库(Janusgraph),最后采用shacl推理完成s

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    1
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服