ID:163838

严捷

数据分析师

  • 公司信息:
  • 思考乐教育服务有限公司
  • 工作经验:
  • 2年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 周日
  • 所在区域:
  • 深圳
  • 福田

技术能力

1、2年以上网络爬虫开发经验;
2.熟悉python/javascript语言,熟悉Linux开发环境和常用命令;
3.熟悉mysql、 redis , nosq等熟悉Internet基本协议(如TCP/IP. HTTP等);
4.熟悉htm/css/xpath/ajax/xml等常用web知识熟悉selenium等常用爬虫技术
5.精通|网页抓取原理及技术,熟悉正则表达式,从结构化的和非结构化的数据中获取信息;
6.能够解决封账号、封IP采集等问题解决网页抓取、信息抽取等问题构建完善的网络信息收集平台;

项目经验

WechatSogou 微信公众号爬虫。基于搜狗微信搜索的微信公众号爬虫接口,可以扩展成基于搜狗搜索的爬虫,返回结果是列表,每一项均是公众号具体信息字典。

DouBanSpider 豆瓣读书爬虫。可以爬下豆瓣读书标签下的所有图书,按评分排名依次存储,存储到Excel中,可方便大家筛选搜罗,比如筛选评价人数>1000的高分书籍;可依据不同的主题存储到Excel不同的Sheet ,采用User Agent伪装为浏览器进行爬取,并加入随机延时来更好的模仿浏览器行为,避免爬虫被封。

zhihu_spider 知乎爬虫。此项目的功能是爬取知乎用户信息以及人际拓扑关系,爬虫框架使用scrapy,数据存储使用mongo

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    1
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服