1.机器学习:熟练使用sklearn、keras建立机器学习模型(线性回归、决策树、xgboost等)以及深度学习模型(RNN、LSTM)
2.数据处理:能够熟练使用pandas对数据进行切片等操作
3.数据可视化:能够使用matplotlib、seaborn、pyechart作出各种精美的统计图表
4.数据爬取:能够用python编写爬虫程序
交互式全国疫情地图:通过编写爬虫程序获取疫情相关数据,再利用pyechart库完成绘制
通过爬虫程序获取美国民主党与共和党议员的Twitter文章,并计算各个账号在一个时间段内与疫情相关的推文数量所占的百分比,然后利用python中的scipy库对样本进行了T检验
利用stata软件建立向量自回归模型,对上海车牌拍卖的最低成交价格的时间序列数据进行预测
利用淘宝网用户点击数据,根据A/B test检验不同方案对点击量的效果