计算机语言: Java、Scala、Python等
开发工具:IntelliJ IDEA、Pycharm等
熟悉Hadoop、Spark、Hive等大数据存储运算系统
熟悉Spark Core、Spark Sql、Spark Streaming、Spark Mlib等组件的原理及使用
熟悉分类、聚类、集成学习等机器学习算法
熟悉RNN等深度学习算法以及常用深度学习框架Tensorflow的使用
熟悉大型分布式Tensorflow架构的原理及使用
阅读书籍:《Hadoop权威指南》(Tom White)、《图解Spark核心技术与案例实战》(郭景瞻)
《机器学习实战》(Peter Harrington)、《Spark内核设计的艺术-架构设计与实现》(耿嘉安)
《统计学习方法》(李航)、《统计学习要素》(特雷弗·哈斯蒂)等
2018.4—2019.12 多触点归因模型--MTA(京东广告数据部广告效果组)
项目描述:
京东广告数据部为了给广告主提供合理规划渠道营销预算,实现ROI最大化,而提出的一种归因模型。该模型是考虑转化路径上的每个接触点,从整体角度分析不同的广告投放对转化的贡献。采用LSTM+Shapley Value计算广告点击对于用户下单转化的贡献值,首先利用LSTM预测不同转化路径下用户下单的概率,然后利用Shapley Value计算每个触点对下单的贡献。
项目职责:
负责整体Pipeline框架的设计以及开发,对接不同业务线为广告主提供服务;
利用Tensorflow搭建RNN模型,开发大数据量下的分布式框架,并提供实时服务;
优化模型,将第一版效果AUC从0.67提高到0.89。
2019.7—至今 个性化优惠券—Personalized Copon(京东广告数据部广告效果组)
项目描述:
传统优惠券发放大多根据运营经验随机发放。实际上每个用户的价格弹性系数均不相同,因此可以结合用户自身的价格弹性来分配优惠券。力求在有限成本下,通过千人千面的券面额发放达到提高转化、收入等目标。因此研究了个性化优惠券模型,服务于京东商城的离线发券场景以及广告服务在线发券场景。
项目职责:
构建和设计底层贝叶斯模型,结合MCMC模拟刻画用户的价格弹性系数和购买力参数;
离线发券部分,设计和搭建离线发券计算平台;结合价格弹性系数设计机器学习模型来计算发券得分,结合运筹学中资源分配算法完成券的最终分配;
广告实时发券,推动设计并开发实时发券计算框架,并成功应用到京东APP首焦场景。
2021.9—至今 营销方略选人选品(京东广告数据部广告效果组)
项目描述:
现有广告主对应的店铺或者品牌下有众多的商品,广告主在进行广告投放时无法有效地根据推广目标(点击、转化、或兼顾)进行选品,另一方面,在知道投放的商品时,无法给已知的人群进行细化,挑选细质人群进行投放;因此,研究了机器学习模型对广告主的投放进行合理指导,提高广告主的投放效率。
项目职责:
开发CTR模型以及CVR模型;
搭建整体Pipeline,能够支持广告主选人,供其挑选人群;同时可以帮助广告主进行目标选品。
专利:
一种基于模拟的优惠券策略更新方法。
一种基于强化学习的商品定价方法。
一种基于预测的实时优惠券预算控制系统。