熟练掌握python语言,包括数据采集(爬虫),数据清洗(按需求进行数据清洗及整合),数据可视化(将分析结果利用tableau转化为可视化的结果), 熟悉自然语言学习的处理流程,熟悉常见用于建模预测的机器学习的算法,如SVM, LR 等等。
项目1名称:人口信息分布爬取
利用Python包request,re, 在目标网站获取所需信息,爬取后按需求处理之后存储成后端所需的数据格式。
项目2名称:App 评论的情感分析
对目标app的评论进行自然语言处理后,建立模型对评论进行情感等级划分,准确率达到60%。