1.熟练使用python语言,linux开发环境;
2.熟悉数据库MongoDB、redis、SQL等的使用;
3.熟悉Docker技术的应用;
4.熟悉开发基于flask的爬虫接口;
5.掌握pythonWeb前端开发,个人网站:taojinmin.com;
6.熟悉抓包软件fiddler、chales的使用;
7.掌握selenium自动化工具的使用;
8.熟悉scrapy及其分布式系统设计的原理。
1.YY的合作项目,开发脚本,定时获取大淘客上商品榜单的信息;
2.某咨询公司的亿级数据处理;
3.开发接口,获取微博的搜索内容;
将分布式平台crawlab集成到个人网站的8080端口,并且配置好redis、mongo以及主从服务器的节点,高效、直观地提高爬虫效率
基于python的flask框架,开发爬虫接口,返回列表数据的详情;将爬取端的规则、逻辑等部分跟数据处理、储存分离。