ID:228418

罗洪

数据采集工程师

  • 公司信息:
  • 福缘科技
  • 工作经验:
  • 1年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 可工作日驻场(自由职业原因)
  • 所在区域:
  • 深圳
  • 宝安

技术能力

1. 精通Python语言,熟练掌握正则表达式、Xpath、CSS等网页信息抽取技术;
2. 熟悉常用的库requests/parsel/json/csv/gevent等;
3. 熟悉异步并发爬虫,多线程,多进程以及协程爬虫
4. 熟练掌握主流爬虫框架scrapy;
5. 熟悉常见反爬机制,如headers和cookie认证,以及验证码和各种滑动验证识别,有自建IP代理池并应用IP代理池进行伪装爬取信息;
6. 熟练掌握应用Selenium实施动态抓取;
7. 熟悉使用fiddler抓包工具;
8. 熟悉mysql、mongodb、redis数据库
9.了解各种加密算法,对解决js加密反爬和字体反爬也有一定应对经验

项目经验

足球赛事数据获取
项目描述:
1.对历年及最新的球赛数据进行抓取。
2.分析目标站点,确定采用抓取的方式,优化抓取流程。
3.分析反爬机制,采取合适的反反爬方式。
责任描述:
1.分析网页的结构,决定采用接口爬虫。
2.分析每个国球球赛数据公布的url的差异,构建正确的Request请求。
3.使用xpath、re、css解析网页的数据。
4.在Scrapy Downloader Middleware 中配置随机的User-Agent、代理IP。
5.使用Pipeline 将数据存储到mysql、csv、json等。
6.在settings中配置失败重启次数、超时时间以及启动下载中间件与pipeline。

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服