熟悉C++/Python, 了解 Java、Shell, 熟悉基本数据结构和算法, 有良好的编程风格;
有丰富的基于 Sklearn / Pandas / Numpy / Matplotlib 等框架的机器学习算法开发经验;
熟悉数据挖掘、机器学习领域基本算法。
十强 (9th/4240) 京东 JData 算法大赛-高潜用户购买意向预测
十强 (10th/2810) 天池菜鸟-需求预测与分仓规划算法比赛
第二名 (2nd/547) CCF 大数据比赛农产品价格预测分析 三好学生 中科院三好学生
铜牌 ACM-ICPC 国际大学生程序设计竞赛亚洲区域赛西安、上海赛区
铜牌 ACM-ICPC 国际大学生程序设计竞赛亚洲区域赛成都赛区
一等奖 第五届” 蓝桥杯” 全国软件设计大赛 C/C++ 本科 B 组
一等奖 国家励志奖学金、校一等奖学金
京东 JData 算法大赛-高潜用户购买意向预测 (9th/4240)
• 核心队员,XGB+LR 和 Stacking 模型构建, 利用 xgb 叶子节点索引提取 one-hot 特征,利用分裂信 息将特征分 bins,给 LR。
• 利用 word2vec 技术将 id 特征转化成 vector 特征,喂给 XGB。
• 采用 wide and deep 框架, 进行推荐预测。
文本匹配实验项目 2017.03 – 至今
• 实现词袋文本匹配传统模型,包括 BM25 模型、xgboost 模型、FM 模型,其中 FM 模型利用了 TF-IDF 的 one-hot 特征,计算相似度;
• 实现语义文本匹配深度模型,利用 word2vec 算法计算词向量,采取 CNN 和 MLP 深度学习算法, 建模文本隐向量,最后进行打分预测;
• 深度模型和传统模型的结合,利用 stacking 和技术,将传统模型和深度模型集成,进行相似度预 测;
• 相关技术和框架: tensorflow, stacking / ensemble, 采样, 连续特征离散化, 特征平滑