1、掌握SQL语言,能在MYSQL、HIVE环境下对数据进行增删改查
2、掌握Python语法,会用numpy、pandas、matplotlib进行数据清洗、数据分析和可视化
3、Tableau、Pyecharts数据可视化,Excel工具使用
4、PS技术
5、Python数据采集
1、某平台订单数据分析
项目介绍:
对当天销售数据进行数据分析,了解大家电在平台的销售情况:不同价位的大家电销售情况,不同时间段的销量分布,销量TOP的地区情况,大家电品牌在销量TOP地区的占比等。
负责内容:
1、使用python语法结合pandas分析库,进行数据清洗,计算出订单数据总体特征
2、从时间、地区、品牌等多个维度分析,使用python可视化工具展示,观察分析当日用户行为
3、整理信息,分析结论。
项目详情见:https://zhuanlan.zhihu.com/p/264987578
2、lego销售情况分析
项目介绍:
收集数据,通过乐高在淘宝&天猫的销售情况挖掘乐高在国内的:供应链分布,用户搜索相关关键词,不同价位的乐高销售情况,销量TOP的乐高店铺主要销售的乐高类型。
负责内容:
1、使用python语法结合pandas分析库,进行数据清洗,数据字段构建
2、从店铺、地区、商品等多个维度分析,使用python可视化工具展示,观察分析销售情况
3、整理信息,分析结论。
项目详情见:: https://www.kesci.com/home/project/share/e25ed7c57f1f6682
项目介绍: 对当天销售数据进行数据分析,了解大家电在平台的销售情况:不同价位的大家电销售情况,不同时间段的销量分布,销量TOP的地区情况,大家电品牌在销量TOP地区的占比等。 负责内容: 1、使用python语法结合pandas分析库,进行数据清洗,计算出订单数据总体特征
项目介绍 收集数据,通过乐高在淘宝&天猫的销售情况挖掘乐高在国内的:供应链分布,用户搜索相关关键词,不同价位的乐高销售情况,销量TOP的乐高店铺主要销售的乐高类型。 数据集的字段主要有:商品标题,适用年龄,价格,销量,评论数量,商品详情URL,店铺名称,地理位置