ID:225340

搜索算法工程师

  • 公司信息:
  • 美团
  • 工作经验:
  • 2年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 周六
  • 周日
  • 所在区域:
  • 北京
  • 东城

技术能力

熟悉 Linux 系统,Python,shell,Hadoop 等。了解并可以使用 c++,Java,PHP,MySQL。
熟悉机器学习常用算法模型。LR,SVM,决策树,朴素贝叶斯等。
熟悉常用深度学习模型等。RNN,LSTM,BERT等。
熟悉 NLP 中文本分类相关算法,熟悉文本相关性算法等。熟悉文本数据处理流程。
熟悉广告算法相应术语,搜索广告流程等。
熟悉搜索算法整体流程,各个模块涉及算法等。

项目经验

一、查询分类升级
项目简介:查询分类是将查询词进行自动化分类的过程,由于目前线上查询分类为朴素贝叶斯模型+相应规则,模型较为陈旧,需要对现有的模型进行更新升级。
个人工作:
1、模型训练。根据标注数据,利用 TextCNN 进行模型训练,并调整相应的一些参数,得到模型。
2、微调。根据分类得到的结果,加入相应的规则,提高其预测准确率。
3、工具封装。将 textCNN 模型参数进行提取,利用 c++编译成可以执行的 bin 文件,当做日常查询分类工具。
4、上线。将模型进行上线,并观察效果。 成果收益:完成查询分类模块升级,使最终分类准确率绝对值提升 5%,并将模型进行封装,作为组内公共工具使用。
二、华章:查询词-文章内容相似性模型开发
项目简介:华章项目是泛搜索场景的一种,旨在提高搜索广告整体收入。当用户搜索特定词汇时,为用户推荐相应的文章并展示在页面,当 用户点击该文章时,在跳转页为用户展示相关广告。
个人工作:
1、文本相关性模型获取。根据已有标注训练数据,利用 bert 模型进行相关性模型训练,最终得到相关性模型工具。
2、query 文章配对。利用 bert 模型对 query 和文章相关信息,包括标题等信息,进行相关性结果获取,并进行排序处理,得到 查询词和文章集合的配对。
3、多路召回。根据原始词表进行推荐文章召回,根据反向切词进行推荐文章召回。 成果收益:完成华章新产品项目,使总体消耗提升 2%,并将 bert 相关性模型进行封装,作为组内公共工具使用。
三、下方推荐广告:以词推词模块开发
项目简介:为了提升搜索广告整体的广告覆盖率(PVR)等,需要对上方未出现广告的情况下,对查询词进行词语推荐,并利用推荐词进行 广告召回,并展示在下方,故称为下方推荐广告。
个人工作:
1、推荐词获取。利用向量传播算法,利用网页侧 query 和点击 URL 数据,进行迭代求取,最终得到查询词和推荐词集合。
2、进行多路召回。根据原始词表进行词汇召回,根据反向切词进行推荐词召回。 成果收益:完成下方推荐广告开发,整体广告覆盖率提升 4%,总消耗提升 8%。
四、文章向量获取服务搭建
项目简介:搭建舆情系统文章向量获取服务,以供上游任务使用。例如相似文章获取,热点事件发现等。
个人工作:
1、调研文章向量获取服务方式,并选择相应模型进行实验开发。
2、使用 bert 和 fasttext 模型进行实验分析,并利用相应数据训练模型。
3、使用 python diango 框架进行服务搭建,并利用 uwsgi 和 nginx 提供服务并发请求数量。 成果收益:完成整体服务搭建,bert 和 fasttext 实验结果满足线上可用,其中 fasttext 并发请求量可以达到 4000,bert 并发请求量可以达 到 1000 左右。
五、相似文章获取服务搭建
项目简介:针对业务需求,需要从文章库中获取最相似的 topk 文章,由于库文章数量较多,需要一种快速获取相似文章的方式,故需要调研 并开发快速获取相似文章的服务。
个人工作:
1、调研相似文章获取相关方法。
2、使用 facebook 的 faiss 框架进行文章索引的存储,使用其中 indexIVFFlat 方法和 IndexIVFPQ 索引进行存储。
3、使用 python diango 框架进行服务搭建,提供 4 种不同索引的增删查的方式,并利用 uwsgi 和 nginx 提供服务并发请求数量。 成果收益:完成整体服务搭建,使用 faiss 框架进行构建的方式可以由原来分钟级别的时长缩短到毫秒级别,并支持批量文章同时访问,时间 依然为毫秒级别,并发搜索请求量可以达到 4000 左右。

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    2
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服