ID:203754

Sitoi

爬虫工程师

  • 公司信息:
  • 中云数据
  • 工作经验:
  • 3年
  • 兼职日薪:
  • 1000元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 上海
  • 闵行

技术能力

- 熟练基于 Scrapy 框架进行分布式爬虫(Redis),利用 Xpath,BeautifulSoup,Re 进行数据清洗,并解决登录,Javascript混淆,等各种反爬措施。
- 熟悉 Docker 微服务架构,对于工业大数据平台有一年半的开发经验。

项目经验

● 主持数据源组的日常管理,工作细化划分,布置每日任务
● 负责构思并实现 爬虫 -> 数据集 的自动化流程的需求分析,可行性分析及开发
● 负责构建 ip 代理池、cookies 池,及其维护
● 负责数据的清洗、解析、爬取的去重以及进行数据挖掘与研究。通过 pandas 实现新闻类数据的自动清洗
● 组内工作流程完善优化

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服