精通scrapy框架和python爬虫,可以分布式部署和分布式爬取,可以保存到mongodb数据库或是excel、txt,图片可以下载保存到本地文件夹,可以自动登录和可视化自动操作浏览器。可以根据需求多进程爬取和流量或时间控制,懂得使用代理,可以维护代理池。
可以爬取京东等电商网站的商品,可以爬取图片网站,并保存到本地和数据库,具有一定的反爬虫技术,可以爬取json、html等类型数据,可以爬取ajax技术网页。
企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才
关注猿急送微信平台,接收实时人才推送