ID:131757

小兵兵

爬虫工程师

  • 公司信息:
  • 搜狐科技
  • 工作经验:
  • 2年
  • 兼职日薪:
  • 600元/8小时
  • 兼职时间:
  • 可工作日远程
  • 所在区域:
  • 福州
  • 全区

技术能力

熟悉linux shell编程;熟悉Linux系统各类服务环境的搭建;
精通python语言编程;
数据采集和数据分析方向,掌握爬虫工作原理和反爬虫机制(Selenium,PhantomJS,Tesseract),scrapy框架和scrapy-redis分布式框架;
熟悉mysql、mogodb等数据库操作;
了解基本数据结构及算法;
了解FTP、UDP服务器基础知识;
了解TCP/IP网络通信过程;
了解numpy、pandas、sklearn等数据挖掘库;

项目经验

爬取过的50余个小语种,数据清洗、切分后,作语料库语料;爬过的语种:阿尔巴尼亚,美语,马拉地语,旁遮普语,卡纳达语,马拉雅拉语,乌尔都语,印地语,比尔哈语,欧利亚语,泰米尔语等等;(包括新闻,论坛,旅游酒店等网站,每种语言至少2G文本,累计爬取网站500余个)
爬取过八千万条电商数据,进行机器学习打分分析;
爬取过的国内外知名网站:站长之家、天猫、京东、百度贴吧、当当、唯品会、北京法院审判信息网等等;

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    1
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服