2年数据分析工作经验,4年Python数据分析项目经验。
能够熟练地利用Python完成数据爬取(BeautifulSoup,requests等)、清洗(pandas,numpy等)、建模(sklearn,statsmodels等)等工作;
熟悉常用自然语言处理技术,并能够进行情感分析、关键字提取等常见自然语言处理任务。
精通掌握Excel常用函数及数据透视表功能,可以使用Excel完成常用商务报表。
熟练编写SQL增删改查语句;
了解统计学相关知识,以及决策树、逻辑回归等机器学习算法;
能够使用Tableau进行可视化。
在校期间专业课程成绩优异,商业数据挖掘(数据挖据算法 90),数据库设计原理与设计(SQL Server 89),高级商务分析(R语言数据分析 93),Advanced System Software(C# 99),项目管理与开发实训(java 96)
基于文本分析的企业社会化媒体信息发布与其金融表现关系研究(中央高校基本科研)
• 项目内容:编写Python爬虫爬取了831家上市企业发布的约200万条微博内容,利用My SQL对数据进行管理,
基于Word2Vec实现微博文本向量化并构建企业独特性指标,分行业探究企业微博独特性对其财务表现的影响。
• 项目成果: 毕业论文一篇(外审分数达优秀毕业论文水平),论文修改后被ICDTFE 2019接收,并推荐至SSCI期
刊EMFT(审稿中)
拉勾网数据分析相关招聘岗位数据分析
• 项目内容:编写爬虫爬取拉勾网全国范围内所有数据分析+数据挖掘岗招聘信息,实现数据预处理(异常值、缺失值、重复记录处理)、文本清洗,从城市、薪酬等多个维度探究招聘岗位的需求,基于文本分析、词频统计分析岗位诱惑及职位要求,以词云的形式呈现。
• 项目成果: 获得了该门课程的最高分