ID:380859

Pigsmallstar

爬虫工程师

  • 公司信息:
  • 可口可乐
  • 工作经验:
  • 1年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 所在区域:
  • 杭州
  • 余杭

技术能力

精通Python编程:熟练掌握Python语言,特别是对于网络爬虫开发至关重要的库,如Requests、BeautifulSoup、Scrapy和lxml。

深入理解网络协议:对HTTP/HTTPS协议有深入的理解,能够熟练处理网络请求和响应,以及分析和解决网络通信中的问题。

网页内容解析:具备扎实的HTML和CSS知识,能够准确解析网页结构,定位目标数据,并有效地提取所需信息。

动态内容处理:使用Selenium等工具进行网页自动化操作。

正则表达式:能够运用正则表达式来匹配和提取复杂的文本模式要。

数据库操作:熟悉SQL数据库进行数据存储。

API交互:够熟练使用RESTful API和其他网络服务API来获取数据,了解如何构建和解析JSON和XML格式的数据。

反爬虫策略应对:了解常见的反爬虫策略,并能够开发相应的技术来规避这些限制,如使用代理、设置合适的User-Agent等。

多线程和异步编程:掌握多线程和异步编程技术,能够编写高效的爬虫程序,以提高数据抓取的速度和效率。

数据清洗和处理:具备数据清洗和处理的能力,能够将原始数据转换为结构化格式,为数据分析和机器学习提供干净的数据集。

项目经验

电商平台:包括但不限于天猫、京东、拼多多等数据的大批量抓取,及大量自动化操作。
学术文献pubmed批量化获取信息,及下载。

案例展示

  • IP池

    IP池

    自有ip代理池的建立,爬取各大免费ip网站的高匿代理ip,并对ip进行验证,以确保可用性。及时存放入本地sqlite数据库。阶段性的爬取及验证,清理失效的IP。

  • 爬虫

    爬虫

    利用ip池进行代理ip,提高爬虫的安全性及效率。避免反爬机制,利用scrapy分布式抓取平台的数据。

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系聘用方端客服
联系聘用方端客服