1.掌握SQL语言,能在MYSQL环境下对数据进行增删改查;
2.熟练python基础语法,了解pandas、numpy、matplotlib等数据分析及可视化工具;
3.了解统计学相关知识,以及随机森林、朴素贝叶斯、KNN、KMeans聚类、ARIMA等算法模型;
4.熟悉Tableau可视化工具;
项目介绍:
为了预知用户潜在的购买需求,对用户及商品数据进行分析,根据用户属性、用户行为、商品属
性及时间序列进行拆解分析,得到用户购买力预测模型并进行有针对性的备货及商品推荐。
负责内容:
1.使用python连接MYSQL数据库,并对关键数据进行提取和关联;
2.使用python结合pandas、numpy 等分析库完成数据的清洗及特征的处理;
3. 使用python结合matplotlib等可视化工具探索并展示各特征和标签之间的关系;
4.使用sklearn库拆分训练集、测试集,并构建随机森林、朴素贝叶斯、KNN算法预测模型;
5.通过准确率、精确率、召回率分析模型效果,并结合预测结果完成推荐及建议;
6.编写数据分析报告并完成汇报;