1,python语言
2,正则表达式
3,HTML网页解析
4,xpath语法, css选择器语法
5,对Ajax网页的分析
6,selenium的使用
7,反反爬虫
8,数据库
1,python语言
2,正则表达式
3,HTML网页解析
4,xpath语法, css选择器语法
5,对Ajax网页的分析
6,selenium的使用
7,反反爬虫
8,数据库
1,对腾讯动漫的爬取:运用selenium和PhantomJS对整部动漫的爬取。
2,微信爬虫:从搜狗微信搜索爬取,运用cookie,IP代理池和用户代理池进行反反爬虫,抓取相关关键词的全部内容