ID:307892

Henry

Python工程师

  • 公司信息:
  • 百度
  • 工作经验:
  • 5年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 武汉
  • 全区

技术能力

数据生态:
熟悉大数据生态系统分布式平台工具以及实时数据分析工具等
◆Structured Streaming、FlinkSQL/Client等常见实时流计算框架,Spark、Flink离线批处理计算框架的应用
◆HBase、Hive、Kafka等大数据组件以及Debezium的CDC数据同步组件的使用
◆使用阿里云Dataworks数据中台产品研发,基于ODPS构建离线数据仓库
◆Druid、Superset等实时分析型数据BI工具以及Airflow调度监控平台的使用

推理服务:
熟悉算法服务工程化推理及海量相似计算检索服务框架
◆Triton Server、Gunicore、Ray、TFServing等推理服务框架
◆Faiss、Annoy、Milvus、Redis等大规模Embeddeding向量计算框架

算法模型:
熟悉推荐系统召回、排序、重排等算法和工程化实现
◆基于协同过滤、双塔等向量模型、SDM等序列模型的召回算法
◆GBDT+LR、基于特征交叉模型、Wide&Deep系列模型、DIN序列模型的排序算法
◆基于运行策略规则的重排方案及多业务线Feeds留曝光的混排方案实现

编程语言:
Python、Scala、C/C++、Shell、SQL
Pandas、Numpy、PySpark等基于Python语言的数据分析和算法开发

项目经验

● 警务政务门户推荐系统
项目介绍: 基于协同过滤的警务政务推荐系统,收集用户操作轨迹,为用户的日常工作提供建议
1. 基础数据服务建设
◆ 服务门户推荐逻辑开发,数据提取处理,为推荐系统提供政务门户专业基础服务数据
2. 用户数据分析,用户行为画像建立
◆ User Cluster精品图推荐引擎,用户、物品特征数据聚类处理,推荐候选集入库(Redis)
3. 个性化私人服务推荐
◆ 提取tag分词,准备用户推荐行为及物品特征数据,用户User Service偏好预测User Model建模
职责描述:
◆ 1. 参与数据中心设计与搭建、警务推荐系统架构设计相关工作
◆ 2. 参与开发离线MR计算,实现协同过滤CB、CF算法对用户行为数据挖掘
◆ 3. 采用机器学习算法对用户偏号预估的Ranking Model模型打分,数据包装检索推荐

● 大数据网站日志分析系统
项目介绍:收集Web服务日志,提供日志分析服务,获取网站流量,提供网站分析数据依据,提升网站用户体验
1. 网站离线分析,掌握流浪规律,优化网站结构和内容
◆ 采用MapReduce、HDFS、Hive等组件实现离线日志分析业务框架
◆ Nginx收集日志原始数据,原数据预处理与提取,定制数据持久化存储任务
2. 网站实时分析,分析网站访问在线状况,及时发现异常
◆ 采用Spark Streaming、HBase、Flume等组件搭建实时日志系统架构
◆ 设计采集日志数据进行清洗和转换,日志数据推送,实现对用户多维度统计分析和平台数据可视化

案例展示

  • 直播推荐系统

    直播推荐系统

    直播推荐算法: 1、基于Python语言的多路召回模型开发,包括热门召回、wide&deep模型召回等 2、基于Python语言的排序模型开发,DIN序列模型 3、基于Faiss的相似向量检索引擎开发 4、在直播推荐场景向用户推荐可能感兴趣的主播

  • Flink 电商指标分析系统

    Flink 电商指标分析系统

    Flink电商指标分析项目 项目背景 项目简介 公司有一个正在运营中的电商网站,是一个B2B2C的电商平台,类似京东。 现在我们想了解一下该电商网站的各种用户行为(访问行为、购物行为、点击行为等),统计出PV、UV等数据。 针对这样的大数据分析项目,我们可以采用MapR

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服