ID:249866

王浩

大数据开发工程师 & 爬虫工程师

  • 公司信息:
  • 腾讯
  • 工作经验:
  • 3年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 所在区域:
  • 北京
  • 昌平

技术能力

掌握大数据相关的技术栈:Hadoop、spark、hive、kafka、hdfs等,有过海量数据处理的经验,并掌握hive、spark优化
数据库:mysql、redis
搜索引擎ES
开发语言:python、go
基于linux开发、熟悉shell脚本及linux命令,及sql语言
爬虫相关技术:scrapy

项目经验

1、三角兽科技有限公司流批数据处理平台的搭建
搭建的实时流和批处理平台,用大数据相关技术处理解析日志,并以可视化看板形式展现各种指标。
2、三角兽科技有限公司分布式爬虫系统的搭建
稳定爬取百度贴吧、豆瓣、B站等各大网站
3、腾讯微视搜索相关垂类数据开发
包括用户搜索、微剧搜索、影视综搜索、直播搜索、发布器推荐和搜索等实时数据链路开发
4、腾讯视频与微视合作的短带长视频开发,负责数据部分开发
5、腾讯看点和微视合作的短视频优化项目,负责数据部分开发
6、腾讯微视搜索质量指标体系的搭建

案例展示

  • b站评论爬取

    b站评论爬取

    公司某app下的评论质量不太好,需要爬取b站高质量的评论,经过数据清洗后提供给算法侧的模型,进行训练优化。 我主要担任数据评论的爬取,整个爬取是我独立负责。

  • 分布式爬虫系统的搭建

    分布式爬虫系统的搭建

    公司智能聊天机器人需要实时的语料更新,分布式爬虫系统爬取百度贴吧、豆瓣、水木社区等数据源,将获得的数据进行清洗入库 我负责整个爬虫系统的搭建、数据的稳定爬取、数据清洗入库。整个项目是我独立负责。

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    1
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服