1. 掌握SQL语言,能在MySQL的环境下对数据进行增删改查
2. 掌握Excel技能,能使用数据透视表来帮助处理数据以及了解常用的函数
3. 掌握Tableau,能够利用Tableau Desktop进行建模并可视化
4. 掌握Python的基本语法以及数据分析的相关技能,如Numpy,Pandas, Matplotlib,Seaborn,能够使用它们进行数据
清洗、数据分析以及数据可视化
新冠疫情可视化 2022年05月 - 2022年05月
负责内容:
1. 利用Tableau展示不同国家的确诊和治愈的人数
2. 绘制新冠疫情的趋势线和变化图
3. 将新冠疫情的死亡人数根据不同国家来排序
4. 使用DashBoard来整合结果
项目详情见:https://public.tableau.com/app/profile/rafael7393/viz/Cov-19Cases/C-19INTL#1
班加罗尔房价预测 2022年03月 - 2022年04月
负责内容:
1. 使用Python结合Pandas库,对超过10000条数据进行数据清洗、降维,去除空值,并编写函数来处理异常值和极端值
2. 利用Matplotlib展示不同地区的楼价分布图以及每平方英尺所拥有的房屋数量
3. 构建线性回归模型并用K折交叉验证来衡量模型的精度
4. 利用GridSearchCV找出最佳的模型
5. 使用最佳模型来展示不同地区以及不同户型房屋的价格