1. 熟悉Linux开发环境,熟悉python,了解Java后台开发,python数据采集(scrapy框架),熟悉web前端开发
2. 熟悉分布式计算平台Hadoop、Hive
3. 熟悉SQL,了解MySQL
4. 了解pandas
5. 熟悉工具:Git, SVN, Confluence, Jira
6. 具有从海量数据中提取有效信息,进行聚合,分析到可视化的整套实践能力
7. 具有数据仓库建设经验
8. 能快速理解业务,发掘业务细节与数据之间的联系
9. 自我驱动,良好的沟通表达能力、团队协作意识以及抗压能力
1. 负责酒店评论数据自动化分析平台的设计、搭建和优化迭代(平台是0到1的开发)
2. 博客系统搭建:个人博客展示
3. 各大网站数据采集:公共可采集的数据。