个人公众号:WayneData 智能世界
•5年数据分析,3年数据挖掘经验。
•熟悉常用数据分析方法论,熟悉机器学习建模,多次算法竞赛成绩 top 。
•在时间序列预测方向有丰富的经验。
•较为优秀的编程能力,熟悉 Python,SQL 等开发语言。
•熟悉机器学习相关算法,掌握 GBDT类(xgboost,lightgbm),逻辑回归 LR,SVM 等算法原理及使用;了解推荐领域的一些算法原理,诸如 usercf、itemcf、transformer、seq2seq等
销量预测
● 为10+平台品牌商家构建门店下商品未来每天销量预测模型,准确率达到89%(smape),帮助商家更加合理的进行餐品采购来降低缺货与冗余;
模型应用多种机器学习算法,多种特征构建思路以及验证迭代方式,利用 python 语言进行搭建;算法、特征及验证包括但不限于如下:
1.tsfresh 提取历史销量特征;
2.时序形态分类与排序,如趋势度周期度排序,形状聚类。将模式相同的序列聚合一起构建模型;
3.未来潜在值与趋势度量特征;如不同期移动平均/指数平均/holt 移动平均/短期序列线性模型滑窗,未来预测值、未来上扬下跌度量;使基于树模型的集成算法在特征对子集划分时更加准确;
4.使用通过对销量之外的用户细分群体,门店详情,天气,日期,活动等数据构建交叉衍生特征。
5.设计不同验证结构。如每日单独预测与全量预测的 time-split-validation;
● 构建用户忠诚度预测模型,准确率达到82%(smape),模型帮助商家更加精准有效的开展营销活动;
1.模型采用多种特征构建思路:利用外部评分数据和 hive 数据仓库的内部用户行为数据和消费数据构建特征,如小程序行为序列文本(word2vec),商家用户 top 消费商品文本(tfidf),常规统计特征等;
2.模型采用多种算法:lightgbm、xgboost、catboost等