1.掌握Scala,python,shell等开发语言,熟悉Hadoop、Spark等大数据计算框架,能够胜任大数据开发等需求。
2.熟悉推荐算法相关的召回与排序算法,以及常见的机器学习模型(如LR、GBDT、FM、Wide&Deep、DeppFM等)与优化策略,
对CTR预估/CVR转化等场景十分熟悉。
3.熟悉Sklearn、Xgboost、TensorFlow2.0等常用机器学习建模与调优工具,对模型的开发与部署较为熟悉。
4.对python后台开发有一定经验,可胜任日常开发工作。
1. 商品购买预测:根据用户的购买历史记录进行召回与排序建模预测用户可能感兴趣或购买的物品,召回阶段主要利用协同过滤与
Item2Vec等算法进行多路召回,然后利用FM算法对召回结果进行排序,最终CTR提升了30%左右,CVR提升了近35%。
2.个性化电影推荐系统
(1)对用户兴趣进行建模:对用户历史点击观看过的电影标题使用TF-IDF抽取TopK个关键词,然后通过Word2Vec模型获取其兴趣向量,用于i2i的推荐。
(2)协同过滤召回:利用用户历史观看记录与打分情况通过CF算法进行候选集召回。
(3)排序阶段:提取用户特征、兴趣向量、物品特征、交互特征等数据,利用LR/FM等算法进行CTR预估建模,并调研Wide&deep/DeepFM,使用tensorflow serving进行模型部署推理。
3.运营商套餐智能推荐:根据用户购买历史记录、用户特征、套餐特征等数据,利用LightGBM进行建模来预估用户对不同套餐的喜好程度,从而帮助用户更换更为合适的套餐,提高用户满意度以及运营商收入。