主要语言Python,熟悉c#,三年爬虫经验,应对各种反爬机制,熟练掌握谷歌控制台的使用,分析动态加载的数据,熟练爬取网站的信息,做过各大搜索引擎的搜索内容爬取,微博的登录和评论回复内容的抓取,精通Xpath网页数据分析,熟练使用selenium模拟登录。
最近做过的项目有 百度谷歌雅虎msn搜索结果的下载,微博的登录,对微博的各项指标,对微博的内容以及评论进行爬取,主要是构造链接获取json数据,爬取速度快。以及微博的监视,监视对方是否有新的微博发送,检测之后发送邮件,短信,或者语音电话进行通知。