产品经理:原型设计、Axure、Visio、需求管理、需求设计
爬虫工程师:分布式爬虫、异步爬虫、百万级、千万级海量数据获取、js逆向、app爬虫
数据分析
数据挖掘:数仓ETL融合内外部数据,迭代用户职住地画像,评估数据质量,进行数据验证,基于综合数据集,分析用户的行为
机器学习:利用KNN、XGBoost等多个机器学习模型完成模型集成,精通数据挖掘与机器学习、Python数据分析
• 项目简介:数仓ETL融合内外部数据,迭代用户职住地画像,支持家充桩升级推广等多个业务决策。 • 项目角色:主负责人,团队3人 • 项目动作:
前期:评估数据质量,进行数据验证,批量获取房天下小区数据,高德API数据,国内4s店数据,结合内部数据构建综合数据集。
中期:基于综合数据集,分析用户的充电、换电行为和出行轨迹,挖掘用户的出行习惯和行为特征,输出数据可视化分析报告。
后期:利用KNN、XGBoost等多个机器学习模型完成模型集成,对用户的消费能力、潜在挖掘价值等多个数据指标进行打分,完成用户
画像,并设计部署数据看板和数据监控。 • 项目结果:迭代了用户职住地画像,看板PV阶段内同比增加150%,业务侧上海闵行区区域公司家充推广增收13%。
充电桩定价预测分析(Python、机器学习、Hive SQL):
目的:对充电桩合理定价,制定一桩一时一价的定价方案,最大化提升营收。
动作:协同LM完成充电桩定价的相关分析,并用已有的数据完成相关指标计算和特征提取;评估GBDT模型、Stacking集成模型、时序
模型等多种方法的预测效果,完成模型检验分析,并根据模型结果设计ABtest实验,进行模拟经营;监控实验运行和AB评估。
结果:实验组充电量、排队时长指标分别提升24%和10%,输出实验报告,完成归档,在后续价格调整后首月GMV上升15%。
指标体系搭建(Hive SQL、Tableau):
目的:评估城际点位资源的场站利用率,基于OSM模型搭建评估充换电资源指标体系。
动作:与场站运营专员沟通并自主学习相关案例,基于目标&策略&度量梳理指标口径,进行小样本数据探查;对覆盖率、充电次数等
多个指标进行切片,评估重合度和相关性,迭代指标口径与监控阈值;输出评估城际充换电资源的指标框架。
结果:搭建指标数据监控看板并传播,看板PV每日100+,并与30多位正式数据分析师、数据运营专员做了分享。
指标体系搭建(Python+帆软BI):
目的:完善电商平台的销售指标体系,评估竞品竞店的差异,协助数据分析同事完成决策
动作:设计Python爬虫程序,获取抖音、淘宝第三方数据、小红书以及微博等平台的数据;基于AARRR模型协助数据分析师、数据运营
制定销售指标体系;对数据指标进行监控,每日复盘指标波动,进行数据归因,为直播销售业务决策提供支持。
结果:3.8大促GMV同比上升34%,50+任务活动周期内正常运维。
角色 | 职位 |
负责人 | 数据分析师 |
队员 | 产品经理 |
产品经理,车队管理平台设计 设计功能,包括用车申请,车辆信息,派单流程,各节点审批流程,上传的文件模板,导出信息等。
包含以前爬过的数据,汽车之家的车辆型号、品牌等,还有一些房产数据,包括挂牌价格,小区特征等等,都是比较大批量的数据,小区数据更是达到百万级别