ID:217964

villi

Python爬虫工程师

  • 公司信息:
  • 杭州华泰一媒文化传媒有限公司
  • 工作经验:
  • 3年
  • 兼职日薪:
  • 800元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 所在区域:
  • 杭州
  • 西湖

技术能力

 精通: Python基础、Office、HTML
 熟练:CSS、JS、Ajax、Scrapy、Xpath、Re、Requests、Selenium、MySQL、Redis、Mongodb,Postgresql
 熟悉:Django、Pandas、Numpy、Matplotlib、HDFS、Tesseract、Sklearn、Git

项目经验

1) 项目概况:
招标网站:财政厅浙江政府采购网、各县市区公共资源交易网、温州招标网
温州政彩云、温州国企采购平台
关键字:调查、清查、普查、建库
采集内容:数据来源、发布时间、招标公告、招标网址
2) 遇到问题及解决方案如下:
1. 分析目标网站真实request地址和response内容,使用IP代理池试水网站反爬虫级别,检测是否有投毒数据。
2. 采用IP代理池及随机User-Agent反反爬
3. 采用re获取网页数据
4. 保存数据到Excel中
5. 使用logging模块编写监控程序进行爬虫监控,并根据日期定向输出日志到log文件

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服