ID:281956

Flipped-199605

Python全栈工程师

  • 公司信息:
  • 腾讯
  • 工作经验:
  • 3年
  • 兼职日薪:
  • 1000元/8小时
  • 兼职时间:
  • 下班后
  • 所在区域:
  • 北京
  • 海淀

技术能力

后端框架:Django, Flask, Tornado
前端框架:Vue, React, jQuery
数据库:Redis, MySQL
工具:vim, pycharm,vscode
其他:HTTP, TCP/IP, WebSocket
外语:大学英语四级,能流畅阅读英文文档

项目经验

通过异步爬虫爬取HGMD,构建mysql数据库
我的职责

1,采用asyncio+aiohttp以达成高并发,异步请求。

2,通过timeout设置超时重发机制,因为HGMD为国外网站,防止因为网络卡顿导致页面抓取不到产生数据不全的现象。

3,通过继承aiohttp.ClientSession类来保存cookie对象,以应对基于cookie的反扒策略

4,使用xpath进行页面解析,解析出的数据通过PyMysql模块存储于mysql数据
分布式爬虫爬取北京市企业信用信息网
我的职责

首先爬取首页后通过xpath匹配每个的信息块的span后构建请求,并通过scrapy.Request发送请求,用xpath匹配需要的信息。

同时循环创建下一页请求的form表单,通过scrapy.FormRequest发送POST请求。所有爬取的信息缓存到redis数据库中,

最后通过编写python脚本将redis数据库中数据读取出来加入mysql数据库。

其他爬取的网站:搜狐新闻、豆瓣、腾讯新闻网。

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服