项目简述:基于 Funplus 几款游戏内的玩家行为数据,对玩家做时间序列方面的预测(时间 颗粒度:按天),主要包括流失预测和付费预测两大类,具体如下: 1. 流失预测:包括用户流失预测和用户活跃度预测模型 核心部分:主要是对数据进行预处理和特征工程,其中主要是利用滑窗的思想对时间序列数 据进行特征画像(核心时间窗口:候选窗口,历史窗口,观察窗口),训练目标是未来几天用户 是否流失;模型方面选择的是 LGBM 算法框架和 Bi-lstm 模型; 2. 付费预测:包括用户付费概率预测和大 R 预测模型 核心部分:数据处理基本和上面一致,特征工程部分滑窗的思想保留,这里的特征工程画像 主要是围绕着付费进行设计和处理的,包括利用 RMF 模型处理特征等,训练目标是玩家未 来几天是否付费;模型方面依然选择的是 LGBM 算法框架和 Bi-lstm 模型,这里模型在训练 的时候根据用户的生命周期 LV 进行了细化训练;
3. 模型训练管理和线上部署:这里模型训练过程中使用 mlflow 框架对模型训练进行管理和 可视化,主要是能保留和跟踪每一次模型训练的结果和过程;线上部署,因为是任务调度型 的,主要就是写调度流程和并行处理的框架,支持多项目配置,自动获取项目任务等,利用 supervior 保证程序 24 小时稳定运行。