ID:284253

今晚十一点睡🎼

python爬虫工程师

  • 公司信息:
  • 闲不闲信息科技有限公司
  • 工作经验:
  • 3年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 其他
  • 全区

技术能力

1.熟练使用xpath、re、json模块进行数据抓取
2.熟练使用MySQL数据库,熟悉Navicat、MongoDB等数据库
3.有充足的编程能力,了解计算机网络、数据结构,Http/Https协议
4.掌握常见的爬虫、反爬虫知识及应对措施;了解Linux系统
5.熟练掌握request库,Scrapy框架,了解scrapy-redis分布式组件
6.熟悉HTML、CSS、JavaScript等web前端技术

项目经验

项目:Spider Book
项目描述: 爬取各个大型图书网站,如新华书店图书网,在线网上图书一号店等。获取它们图书的名称,简介,购买量,评论量,评论数据,价格等,存入数据库。 
项目技能: requests,Xpath,json,Redis,MongoDB,re

个人职责:1.使用requests模块,发送http请求,使用协程进行爬取网页,提高爬虫效率 
             2.分析需要爬取的数据,发现在ajax请求中,数据格式为json。使用re模块在返回的response.content中匹配需求数据,获取到数据 
            3.自定义get_ua函数,,调用get_ua随机获取user-agent,对request对象来进行包装,应对反爬
4.调用代理ip池,获取代理ip

案例展示

  • Spider Book

    Spider Book

    项目:新闻分类资讯 项目描述:该项目主要爬取各网站新闻的热门,头条,时事热点等信息 项目技能:scrapy_redis,Xpath,Redis,json 个人职责:1.分析url地址,分析反爬策略,实现反反爬抓取数据。在下载中间键(Downloader)的_proc

  • 新闻资讯

    新闻资讯

    项目:新闻分类资讯 项目描述:该项目主要爬取各网站新闻的热门,头条,时事热点等信息 项目技能:scrapy_redis,Xpath,Redis,json 个人职责:1.分析url地址,分析反爬策略,实现反反爬抓取数据。在下载中间键(Downloader)的_proc

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服