ID:282722

林尛

爬虫工程师

  • 公司信息:
  • 北京氢元数据信息技术有限公司
  • 工作经验:
  • 1年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 所在区域:
  • 北京
  • 丰台

技术能力

1.熟练应用Python的库及模块,有良好的编程习惯
2.熟练掌握 MySQL主流关系型数据库开发技术
3.熟练使用re/xpath/lxml解析模块;
4.熟练requests爬虫模块;
5.熟练使用charles抓包工具;
6.熟悉scrapy爬虫框架,熟悉selenium自动化工具;
7.熟悉解决反爬代理ip,验证码处理;
8.熟悉js逆向
9.了解app逆向

项目经验

北大法宝
项目描述:
爬取全国法院1991-2013年的案例
1、爬取所有法院,cookie会过期,需要模拟获取cookie
2、爬取所有法院案例的列表页信息和详情页链接,数据量交大,用的多线程爬取,存到mongo里
3、爬取所有案例的详情页信息,请求比较慢,用的多线程和分布式,将请求放到redis中,并对爬取的数据进行解析、拆分、清洗,存到Mongo里
个人职责:
编写采集程序,解决反爬,数据清洗,分表存储,维护代理ip

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    1
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服