1. 熟练掌握python语言,掌握深度学习、机器学习、强化学习等各种算法,以及相关算法在工程上的应用
2. 掌握spark、hadoop等大数据技术栈
3. 掌握pytorch、tensorflow等深度学习框架
项目名称: 主播推荐
项目描述: 通过机器学习和深度学习算法对用户进行个性化推荐, 提高用户的点击率
个人主要工作: 使用spark对HBase、Hive、Mysql数据进行统计、处理,获取用户和主播的基础特征、行为特征、偏好特征等信息, 以及对相关特征信息存储; 分析数据不同特征的关联度,缺失值、覆盖率以及对数据进行离散化、归一化等操作; 训练CTR模型、查看模型效果, 调整模型参数以及部署模型; 定期查看线上效果,分析结果、迭代优化模型。
项目名称: 用户画像机器系统应用
项目描述: 主要从用户属性、用户行为、用户消费、用户偏好、风险控制等几个角度构建用户画像模型; 基于大数据平台采集分析, 分别从行为特征及业务场景进行数据标签配置, 实现模型与应用数据共享, 实现精细化运营及精确营销服务。
个人主要工作: 参与用户标签需求分析、技术方案选型; 负责部分画像标签的设计开发工作;整合开发标签为宽表、存入hive, 针对不同不同任务部署定时任务。