ID:337182

豆沙馅

爬虫工程师

  • 公司信息:
  • 中兴通讯
  • 工作经验:
  • 10年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 北京
  • 海淀

技术能力

本人多年从事数据采集相关工作,具备以下技术能力:
1、掌握多线程并发编程核心原理,具备开发高性能高并发程序能力;
2、掌握主流爬取技术及爬虫框架工具,如Selenium/Puppeteer/Scrapy/PhantomJS等;
3、掌握反爬虫突破原理,如封账号、封IP采集等问题,解决网页抓取、信息抽取等问题;
4、掌握html,xpath、正则等解析器,具备处理页面结构化和非结构化抽取技术;
5、掌握JavaScript反爬特征,具备突破JavaScript算法和高度混淆能力;
6、掌握瑞数、加速乐、极验、易盾等风控产品处理;
7、掌握千万数据采集架构设计与项目实战经验;

项目经验

一、某医疗平台数据采集
项目简介:基于某医疗平台网站,获取全国定点医疗机构名称、类型、等级及地址;
实现内容:
1、模拟用户发送数据请求,破解请求头、参数、返回值中签名验证反爬部分,并获取数据;
2、数据存储在redis及mongo中;
3、定期更新;

二、某投资社区网站热帖数据采集
项目简介:自动获取某投资社区网站中,帖子的数据,并进行定期更新;
实现内容:
1、模拟用户发送数据请求,破解Cookie中请求参数加密,并获取数据;
2、数据存储在mysql数据库中;
3、定时更新;

案例展示

  • 某投资社区数据采集项目

    某投资社区数据采集项目

    在本项目中,负责分布式⽹络爬⾍系统的架构设计与开发、海量数据的爬取、清洗、解析、⼊库、破解各类反爬机制、提升数据抓取系统的⾃动化⽔平。上述作品中只有核心cookie信息的破解。

  • 某资讯平台数据采集项目

    某资讯平台数据采集项目

    负责分布式⽹络爬⾍系统的架构设计与开发、海量数据的爬取、清洗、解析、⼊库、破解各类反爬机制、提升数据抓取系统的⾃动化⽔平。在作品中,仅展示了自动化采集过程中,用户密码逆向的部分内容。

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服