负责对登录验证码进行训练识别,区分验证码英文大小写,实现对不定长验证码识别,解决语音验证码登录;
负责通过搜索关键字获取关注用户,发送私信,推广公司网站;
负责广告投放监控,关键字推荐,关键字热品,商品/店铺评论,竞争对手店铺监控,实时监控商品被跟卖/差评。
负责兼性能测试,编写自动化脚本测试,了解整个亚马逊商品详情页展示不同,制定不同页面的解析方案;
负责数据的去重,清洗,对于亚马逊ip反爬,检测验证码,制定具体应对措施;
负责解决翻页成功没有数据,数据在网页上无法获取的情况,呈现另一套假的Html页面。
负责根据需要爬取的数据进行需求分析,分析目标网站的网站结构和一些反爬手段;
负责通过requests、scrapy、scrapy-redis、xpath等技术手段编写爬虫程序进行内容抓取,对抓取到的数据进行清洗过滤,分表存储,以供其他部门使用;
负责定期维护ip代理池,清除失效代理ip,根据爬取过程中遇到的一些反爬手段,优化自己的程序;
负责使用web的Django框架参与其他公司内部软件的开发;
负责数据的去重,清洗,对于亚马逊ip反爬,检测验证码,制定具体应对措施。
负责根据需要爬取的数据进行需求分析,分析目标网站的网站结构和一些反爬手段; 负责通过requests、scrapy、scrapy-redis、xpath等技术手段编写爬虫程序进行内容抓取,对抓取到的数据进行清洗过滤,分表存储,以供其他部门使用; 负责定期维护ip代理池,清除失
负责根据需要爬取的数据进行需求分析,分析目标网站的网站结构和一些反爬手段; 负责通过requests、scrapy、scrapy-redis、xpath等技术手段编写爬虫程序进行内容抓取,对抓取到的数据进行清洗过滤,分表存储,以供其他部门使用; 负责定期维护ip代理池,清除失