BI 工具与分析思维类(2018-至今)
EXCEL、POWERBI、TABLEAU
互联网常用数据分析模型如阿里三大营销模型(AIPL\GORW\FAST)、4P\4C 模型、逻辑树模型、人货厂模型、AARRR
模型、RFM 模型等
Python 数据分析(2017-至今)
Python 语法、数据分析扩展库 numpy、pandas、scipy、matplotlib、seaborn、pyecharts
机器学习(2018-至今)
KNN、LinearRegression、Ridge、Lasso、LogisticRegression、DecisionTree、Navie Bayes、SVM、K-Means、DBSCAN、
Bagging、Gradient Boosting、Adaboost、XGBoost 等
PCA 降维、交叉验证、特征工程常用方法、指标评估方法、神经网络、深度学习框架 tensorflow 等
Python 爬虫(2017-至今)
Requests、urllib、Scrapy、xpath\bs4\re 等解析技术、selenium 等
其他方向(2011-2017)
iOS 平台开发技术、Objective-C、swift
SQL\MongoDB\Redis
Golang、Solidity、以太坊智能合约编程、C#、unity3D 引擎开发(官方认证开发者证书)
2021.03-2023.12 前端推广渠道引流效果分析
职位:数据分析
项目简介:根据在公众号、淘宝、拼多多、抖音、朋友圈、B 站等引流渠道得到的用
户信息数据,根据获客数量与质量评估不同渠道的推广质量,为后续推广渠道提供可行性方案;
相关技术:powerbi、excel、python、numpy、pandas、matplotlib、seaborn;
项目职责:
1.整合各个渠道数据,对数据进行去重、缺失值处理、异常值处理等清理;
2.对每个渠道的用户进行次日留存率,7 日留存率,30 日留存率进行比较分析,评价不同渠道的用户质量。对每
个渠道新用户数量、新用户人均使用次数、人均使用时长进行统计,获取每个渠道带来的用户规模;
3.通过不同维度数据对比,对每个渠道用户的付费率和用户平均收益进行对比分析,提高付费客户转化率;
4.使用 Matplotlib 和 Seaborn 绘制各种柱状图和饼图等,显示各个渠道、不同时间点的 UV、次日留存率、3 日
留存率,7 日留存率,30 日留存、用户付费率和用户平均收益(ARPU),其中,课程价格、课程类型、课程时长
对引流课程的转化率影响较大,其次是试听课试听次数以及后期老师跟进具有重要影响;
5.制作相关分析报告,通过对渠道引流效果的分析,筛选出获客成本最低和获客价值最高的渠道,然后继续投放,
对于不好的渠道减少或者停止投放;
2021.03-2023.12 潜在用户挖掘-用户消费行为分析
职位:数据分析
项目简介:
捕获用户每天的行为数据,生成业务日志文件,根据日志文件清洗、分析、提取需要的价值信息,分析潜在客户,
根据用户的看课总时长、频次、课程名称、讲师偏好等特征属性的分析,帮助销售团队有侧重点的制定更好的销
售方案。
相关技术:powerbi、excel、python、numpy、pandas、matplotlib、seaborn、AARRR、漏斗分析
项目职责:
1.分析需求,从数据库中提取近一年内的 7w 条数据,包括用户 ID ,课程 ID ,注册日期、看课频次、学习时
长、购买商品种类等特征;
2.使用 pandas 对数据的缺失值进行处理以及数量类型转换,根据情况使用众数,平均数以及中位数进行填充;
3.对用户个体消费进行分析,使用二八法则以及聚合函数,利用 seaborn 对数据进行可视化,了解消费趋势;
4.使用分析用户行为的漏斗模型 AARRR 模型分析用户使用的各个环节给出相对应的应对措施,比如:分地
区针对用户对价格敏感度高的特性开展拼团转发及打折促销等活动来获得更多的用户使用率;
5.基于 RFM 模型对用户进行用户分群,得到 VIP 用户、高价值用户、潜在用户、低价值用户四类,构建用户画
像,对不同用户群合理制定营销方案提供数据支持。
2021.05-2023.12 SVIP 高级课程用户筛选-用户价值分群
职位:数据分析
项目简介:通过用户的购买课程,购买总金额,学习进度对不同用户做用户画像绘制和价值分群,找出最具价值
的核心付费用户群;并为新产品指定营销方案提供可参考数据;
相关技术:pandas、numpy、matplotlib、seaborn、RFM 模型、python
项目职责:
1.使用 Pandas 对用户的数据进行去重,缺失值处理,异常值处理等整理;
2.根据业务需求,将学员信息表和购买记录表关联合并,根据学员开课时间、购课总金额、学习进度对学员做 RFM
分群,构建学员标签,并对标签做映射;
3.利用 KMeans 算法对学员做聚类分析及可视化;
4.对学员户进行精细划分并分析不同群体带来的价值差异;
2018.05-2021.11 消费信贷信用评分卡(ABC 卡)
职位:数据挖掘
项目简介:
该项⽬是基于公司现有技术架构建⽴起来的⼀个风控的项⽬,包括 A、B、C 卡三种模型,主要针对公司合作的各
个银 ⾏和⾦融机信⽤评分卡 KS 衰减⽐较严重的情况提供技术上的解决⽅案,⾸次应⽤的中银消费⾦融有限公司
的贷前 KS 优化中,取得了 不错的成绩。
相关技术:miceforest 插值填补、卡⽅分箱、XGBoost 特征分析、Boosting 集成学习、python、LR。
项目职责:
1.负责项⽬整体的架构设计与落地,项⽬中长期⽬标的规划。
2.通过插值填补法,采⽤miceforest 框架对数据集中的缺失数据进⾏填补。
3.采⽤卡⽅分箱等有监督分箱的⽅法对部分特征进⾏分箱处理。
4.完成数据的特征选择,对特征分箱处理,以及 WOE 和 IV 指标的计算与评估。
5.通过 Boosting 集成⽅法对评分卡模型进⾏集成学习构建和
捕获用户每天的行为数据,生成业务日志文件,根据日志文件清洗、分析、提取需要的价值信息,分析潜在客户, 根据用户的看课总时长、频次、课程名称、讲师偏好等特征属性的分析,帮助销售团队有侧重点的制定更好的销 售方案。 相关技术:powerbi、excel、python、numpy
项目简介:根据在公众号、淘宝、拼多多、抖音、朋友圈、B 站等引流渠道得到的用 户信息数据,根据获客数量与质量评估不同渠道的推广质量,为后续推广渠道提供可行性方案; 相关技术:powerbi、excel、python、numpy、pandas、matplotlib、seabor