1、熟悉Linux下的python开发,会用pandas、matplotlib进行数据清洗、数据分析和可视化;
2、掌握SQL语言,能在MySQL、Oracle环境下对数据进行增删改查;
3、熟悉爬虫开发,了解常用爬虫框架如Scrapy、Requests、Xpath等,熟悉常见的反爬手段并掌握应对方法;
4、熟悉kettle、datax等ETL工具;
京东手机评论分析(2021.09-2021.10)
1、获取某款手机的京东评论数据,历史数据为csv文件;
2、利用pandas工具对数据进行预处理;
3、利用matplotlib制作情感分布直方图,利用jieba分词库及wordcloud词云分别生成积极、消极评论词云图;
4、分析总结了解用户使用体验,得出平台运营的优化建议;