曾任在线教育平台BI负责人, 对业务、需求、数据的理解能⼒好,可根据业务逻辑及可用数据设计各类指标体系、分析框架、报表体系, 输出分析报告或完成自动化日常数据监控及预警;
统计学基础良好,理解底层数据采集和计算逻辑,能够根据分析需要即时独⽴使⽤SQL\R\Python进⾏数据清洗、使⽤机器学习或统计学习⽅法利用python或spark进⾏建模分析、可视化处理, 能根据业务知识写SQL提取标签、结合爬虫、利⽤机器学习算法进⾏特征提取&特征选择产⽣预测类主观标签完成用户画像;
有使用dataphin/dataworks及开源技术进行⼤规模数据处理经历,有数仓建模、SQL性能调优、fineReport报表开发经验,并使⽤Azkaban及shell脚本进⾏ETL流程的任务调度;
有开发python爬虫的经验;
英语熟练,CET-6:512。
⽤户画像、后端服务情况、流量投放主题MySQL数据仓库建模及开发,包括:
建立学员退费⻛险因素相关特征为课程服务团队提供⽀持(包括理解业务需求写SQL提取标签、利⽤机器学习算法进⾏特征提取&特征选择产⽣预测类主观标签);
建⽴达人特征为抖音kol推广优化团队提供支持(爬虫+SQL提取标签);
建立销售线索特征库为销售提供支持.
基于pyspark完成商品频繁项挖掘算法开发以提供产品组合设计支持.