CS:GO 比赛选手数据获取
开发工具:Python3 所用模块或工具:re、math、datetime、Scrapy、Request、elasticsearch、Scrapyd、Xpath、Fiddler 项目目标: 1.对 CS:GO 每场比赛的最佳情况等数据录入 ES 中
2.对 CS:GO 每场比赛所有选手的数据录入 ES 中
具体内容: 1.搭建 Scrapy 框架,并设置 middleware.py、settings.py 等文件所需参数,编写入库 ES 的管道文件
2.分析网页源代码,判断真实源代码,并用 Xpath 提取所需的数据 3.编写 Spider.py,设置 headers 和 cookies 4.录入数据并生成日志文件
5.用 Scrapyd 对爬虫进行监控
项目结果:成功将 100 万+的数据录入 ES
项目收获:使用 Python 对 ES 进行入库操作,学习 Scrapyd 的使用,使用 ES head 对 ES 进行数据操作处理