有6年的实战经验,精通爬虫(国内外数据),数据加工(各种格式),爬取图片、txt、pdf、word、excel等
擅长:python、ruby。爬虫后数据结果可以经得住检验,保证质量
前提:不干违法的活
涉及专利、国内标准等等等等很多数据,项目大部分为保密项目,不方便透漏
在项目往往负责爬取、分析、加工
想要保证数据质量可以找我,做不了的全额返还
针对新浪微博中某微博下的评论信息进行采集,微博信息同样也都可以拿到,及评论人的基本信息,点赞数等等都可以
针对第1ppt网站进行所有ppt的爬取,下载后是压缩包形式,共7000多个。针对全文形式的爬取,ppt的相关信息等