ID:272435

时光境迁yfsi

  • 公司信息:
  • 工作经验:
  • 1年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 可工作日驻场(自由职业原因)
  • 所在区域:
  • 长沙
  • 全区

技术能力

1、熟悉C,python,java语言,掌握常见的数据结构算法。
2、精通python爬虫数据采集,有相关开发经验。
3、熟悉多种数据库,如Redis、MySQL、Oracle、Clickhouse、PostgreSQL等
4、擅长Python爬虫、Web开发(主要用Django)。
5、熟悉Linux基本运维。
6、精通Scrapy数据采集框架。
7、熟悉多线程、异步爬虫开发。
8、熟悉JavaScript反爬机制、字体反爬等手段。

项目经验

1.爬取过梨视频并下载下来
2.爬取豆瓣电影排行榜并以excl方式保存
3.爬取过京东,让客户选择要搜的商品和需要的信息爬取下来保存在excl里
项目名称:通过异步爬虫爬取HGMD,构建mysql数据库

项目描述:
项目介绍
对高通量测序数据进行数据分析时,需要对snp数据进行相关性筛选,为此需要构建基于mysql的基因突变数据库,对HGMD网站相关基因突变信息进行爬取,爬取内容包括基因名,染色体坐标,突变信息,致病信息等。爬取结果存储于mysql。
我的职责
1,采用asyncio+aiohttp以达成高并发,异步请求。
2,通过timeout设置超时重发机制,因为HGMD为国外网站,防止因为网络卡顿导致页面抓取不到产生数据不全的现象。
3,通过继承aiohttp.ClientSession类来保存cookie对象,以应对基于cookie的反扒策略
4,使用xpath进行页面解析,解析出的数据通过PyMysql模块存储于mysql数据库中

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服