ID:391602

周末

数据分析

  • 公司信息:
  • 自由职业
  • 工作经验:
  • 2年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 可工作日驻场(自由职业原因)
  • 所在区域:
  • 深圳
  • 宝安

技术能力

Excel:数据透视表;可视化图表;切片器;VLOOKUP;SUMIFS;REPLACE;SUBSTITUTE 等多种函数。
可视化BI:PowerBI(连接数据库;数据处理 PowerQuery;指标体系搭建 PowerPivot;数据可视化;监测看板)、Tableau。
Mysql:DDL、DML、DQL 语句、模糊匹配、窗口函数、聚合函数、多表连接查询、子查询嵌套、分组排序等。
Python:用 Pandas、Numpy 清洗数据,matplotlib 对数据的可视化处理。
机器学习:KMeans、逻辑回归、决策树、随机森林、朴素贝叶斯、KNN等算法。
数据分析方法论:波特五力;AARRR;RFM;波士顿矩阵;假设验证;逻辑树; SWOT, 4P;PEST;5W2H,用户画像;群组分析。

项目经验

一、项目介绍:了解用户的信息,提取了数据库中2021年淘宝店铺用户订单信息,并对客户进行RFM分类,对不同类型的客户进行精细化运营,并用BI看板展示。
使用工具:Power Bl,mysql,RFM模型
实施步骤:
1.指标搭建:根据现有订单表,搭建指标体系,分为总体运营指标和客户价值指标两大类,其中分为客户基本信息指标,销售情况指标,退款情况指标,客户RFM频率指标(最近一次购买时间间隔R,购买频率F,消费金额M)和其余指标五小类;提前与运营会议确定RFM的打分标准。
2.数据提取及处理:利用mysql语句对数据作如下处理,处理完毕后使用Power BI连接数据库:①使用group by对客户id进行操作,结合timestampdiff和data_format函数与目标日期相减得到最近一次购买时间的天数得到最近一次购买时间间隔R,②使用group by对客户id进行操作,利用data_format函数转化购买日期,对购买日期进行去重计数得到购买频率F,③对每个客户的购买金额进行求和得到消费金额M,④使用with和join进行连接,将处理后数据存入数据库。
3.数据可视化:①RFM模型:利用Power BI中pp对数据集做进一步处理,根据RFM目标打分标准将用户进行8分类。②利用订单表制作近半年来可视化看板,包含总成交金额GMV,总退单率,日、月成交金额,订单量客单价的关系,日、月退单率,性别消费占比,地区消费地图,不同年龄消费金额与客单价关系,RFM占比图等等。
4.结论和成果:①成交金额和订单量在逐步上升,前期小红书运营方式有效果;②RFM模型看,新用户的占比较高,需要采取措施对新用户向重要用户进行转化;③后期有退单率和销量都高的情况,及时反馈给产品部从产品用料查看原因,及时止损;④购买用户大部分属于二线城市及以上,年龄在18-30岁间的客户,后期重点可放在这部分人群。

二、项目介绍:为优化产品结构,提高访客下单率,支付金额等指标,对产品建立波士顿矩阵模型,分析各类产品占比,挖掘热门产品影响因素以及部分产品低增长率的原因。
使用工具:python(pandas、matplotlib)、mysql、波士顿矩阵模型
实施步骤:
1. 数据提取:使用mysql从数据库中提取近半年销售数据
2. 数据清洗:使用python中的pandas模块,查看空缺情况(isnull),删除空缺值超过90%的字段(dropna),绘制箱型图查看异常值,检查数据真实性,替换非真实数据;使用re模块中的正则表达式从收货地址中分别提取省市信息。
3. 数据挖掘:以单个产品为聚合(groupby),对交易增长幅度和支付转化求平均(mean),对交易金额求和(sum),算出单个产品的交易金额占比,对结果进行描述性统计(describe),查看是否有异常值;将产品分为:明星产品(高销售额占比,高销售增长率)、金牛产品(高销售额占比,低销售增长率)、问题产品(低销售额占比,高销售增长率)、瘦狗产品(低销售额占比,低销售增长率)。
4. 数据可视化:使用matplotlib及循环方法对分类产品可视化处理,生成四种产品的散点图,调整图例、标签等,将图表导出svg文件并制作PPT报告,使团队更清晰直观地了解分析结果。

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服