ID:313787

不再迷茫 身份已认证

python爬虫逆向工程师

  • 公司信息:
  • 电信
  • 工作经验:
  • 2年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 所在区域:
  • 西安
  • 全区

技术能力

编程技能:熟练掌握Python编程语言,并且了解相关的库和框架,如Scrapy、BeautifulSoup、Requests等,以便开发和管理爬虫程序。

网络协议和通信:了解HTTP、HTTPS、TCP/IP等网络协议,理解Web请求和响应的过程,能够模拟浏览器行为发送请求并处理响应。

反爬虫对策:熟悉常见的反爬虫机制,如验证码、IP封禁、User-Agent检测等,能够分析并应对这些反爬虫手段,保证爬虫的稳定性和持续性。

数据解析和提取:具备解析HTML、XML、JSON等数据格式的能力,能够使用XPath、CSS选择器或正则表达式等工具从网页中提取所需的数据。

逆向工程技术:了解逆向工程的基本原理和方法,能够分析目标网站的JavaScript代码、加密算法、接口参数等,以便实现数据的逆向工程和抓取。

数据存储和处理:熟悉数据库操作,能够将爬取到的数据存储到数据库中,并进行数据清洗、去重、转换等处理,以便后续的分析和应用。

高效率和稳定性:具备编写高效率和稳定性爬虫程序的能力,包括使用多线程或异步编程提高爬取速度,处理异常情况和错误日志,保证爬虫的可靠性和健壮性。

法律和道德意识:了解网络爬虫的法律风险和道德规范,遵守相关法律法规,尊重网站的合法权益,不进行非法的数据采集和滥用。

持续学习和创新精神:紧跟技术发展的步伐,关注新的爬虫技术和工具,不断学习和探索新的方法和思路,提升自己的技术水平和解决问题的能力。

项目经验

招标项目爬取。逆向广东省网站,小红书爬取,抖音boss直聘爬取,拼多多,巨量星云爬取,犀牛网抓取, 微信公众号逆向抓取, 瑞数4,5代爬取,facebook登录逆向爬取, 知乎头条信息爬取, 某乐指数爬取,某藏品爬取, 51job爬取等

案例展示

  • 娱乐指数

    娱乐指数

    爬取娱乐指数数据,中间用到了逆向的技术已经mongo存储的技术,代码逻辑清晰,逆向思维严谨,我担任的是爬虫的角色,致力处理好所有数据

  • 51job

    51job

    处理招聘网站数据,过程中用到了逆向,逆向过程中因为cookie中有加密所以用到了补环境,熟练掌握补环境技术,浏览器指纹等

查看案例列表(含更多 0 个案例)

评价列表

猿急送用户    2024-07-21 08:53    5星

【该评论为5星(满分)好评,评论人选择不公开展示】

信用行为

  • 接单
    1
  • 评价
    1
  • 收藏
    0
  • 五星率
    100%
  • 退款
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系聘用方端客服
联系聘用方端客服