1、深度学习推荐算法: 联合训练的CTR预测,如wide&deep、cross&deep、deepFM等模型。
RNN:基于SessionBase GRU模型做评分预测。 其他传统算法:矩阵因子分解、逻辑回归等
模型指标及特征工程构建(根据使用模型的类型决定特征构建程度)。如:时序特征处理,tsne流形降维,svd/pca特征抽 取,基于贝叶斯的目标编码,独热码,特征组合,缺失值处理等。
文本数据处理。文本分词、文本编码、tfidf词频统计、ngram矩阵等。 熟悉协同过滤、k-means、层次聚类等距离度量方法。 擅长使用:xgboost、随机森林、决策树等监督学习模型。并了解各模型优缺点。了解集成学习、模型融合思想。 项目实施过程中,负责基于linux平台的环境搭建及模型部署。及相关项目的部署运维等。
主要参与项目:
1、智能问答系统。
2、检索系统
3、推荐系统
4、智能排课系统
5、用户评论舆情分析。
6、以Dgraph图数据库作为社交关系数据的存储和检索架构