经验:0-1负责搭建深度学习的推荐系统
擅长方向: 推荐/搜索/NLP
推荐:召回/排序模型: din, deepfm, mmoe, essm, behavior seq transformer, dssm, milvus,elasticsearch
NLP:知识图谱,信息抽取,实体识别,关系抽取,实体对齐
工具:tensorflow, keras, spark, hive, numpy,pandas, scikit-learn
原理:深度学习,机器学习,大数据处理
推荐系统:
0-1搭建深度学习的推荐系统
推荐模块:数据采集(埋点)->样本生成->数据清洗->特征工程->模型训练(模型结构/调优)->线上推理
指标:两版基线模型(精排), 最终线上AUC至0.77 (ctr预估),DAU增长4倍, 双端留存率(次日留存率) 增长至70%以上。 后续迭代,持续有显著收益(ctr校准/多任务学习/基于线上auc的融合公式探索/位置偏差消除建模/转化延迟建模)等
代码主要是2块: 离线模型训练 + 线上工程推理: 线下训练:模型训练和部署:数据采集->样本生成->模型训练->模型评估->模型部署, 线上推理:ab实验配置-> 特征获取服务 -> 模型预测服务 -> 排序结果生成/展示 -
实体抽取部分: 主要是: 标注语料-> 文本预处理(清洗,brat语料转适应模型输入的训练集) ->模型训练->推理