ID:273464

Gerry 身份已认证

资深大数据开发工程师

  • 公司信息:
  • 北京某科技有限公司
  • 工作经验:
  • 8年
  • 兼职日薪:
  • 800元/8小时
  • 兼职时间:
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 北京
  • 朝阳
  • 百子湾

技术能力

1.熟练掌握 Java 语言使用,熟悉 python、scala 等语言的使用
2.掌握 kafka 原理、使用和常用问题排查及调优;掌握 Flume 原理及使用,具有数据采集系统设计、 规划部署、调优及运维经验 3.掌握 Flink 原理及使用,具有生产环境实时计算项目开发及运维经验
4.熟悉 Hadoop 生态系统相关框架和工具的使用,包括 Hdfs,Yarn,Mapreduce 等常用组件
5.掌握 Elasticsearch、Logstash、Kibana 的使用,具有独自搭建 ELK 集群及组件的优化经验
6.掌握 开源数仓 Hive 及云原生数仓 Maxcompute 的使用,熟悉离线数据仓库建模理论及实时数仓建设
7.熟悉 Impala、Kudu、Presto 等开源及 Hologres 等云原生 OLAP 工具的使用及工作原理
8.熟悉常用的机器学习算法如线性回归、分类、聚类和推荐算法如协同过滤、矩阵分解等
9.熟悉 Mysql、 Redis 等数据库的基本原理及使用
10.熟悉 SpringBoot、JdbcTemplate 等框架的使用
11.熟练运用 Git、Maven 等项目管理及项目构建工具 12.熟练使用 Linux 操作系统,熟悉 shell 语法

项目经验

项目一:娱乐社交互联网公司埋点系统+用户行为日志分析系统+实时数仓
技术栈:Flink + Kafka/SLS + Hologres + Maxcompute
项目描述: 用户行为日志收集和分析系统原来使用的神策数据提供服务,没有自己的离线数仓和实时数仓。但是在业务发展越来越多 样化和用户量越来越大的背景之下,神策数据已经满足不了目前的数据需求。为了替换掉神策同时建设自己的离线和实时数仓, 数据智能团队开始 自有埋点系统和实时数仓的建设。
个人项目职责:
本人在该项目中主要负责整个项目的工程架构设计和技术选型,核心代码的编写,协调各端开发和测试的工作,推动整个项目在业务侧的落地。
1 埋点系统建设
埋点系统建设主要分为三部分:埋点 SDK 研发、埋点模型设计、埋点规范制定。考虑到项目开发效率和技术成熟度,最终采用了神策开源的 SDK 作为埋点上报 SDK,同时做到了全公司各业务各端 SDK 统一化和标准化,制定了埋点端到端采集的规范,设计出灵活、全面、复用性高的埋点模型。
2.埋点日志收集及在线分析系统建设
埋点日志收集及在线分析系统分为三部分:埋点日志收集技术架构设计、埋点日志实时 ETL 技术选型、OLAP 组件选型。 针对需求分别设计了开源组件架构和云原生组件架构两种架构方案,在技术完整性、项目成本、项目可维护性等考虑之下最终选择了云原生组件架构。该项目使用阿里云日志服务(SLS)作为日志接收、传输和日志总线组件,使用Flink进行用户埋点ID-MAPPING和埋点日志实时ETL,使用分析型数据库 Hologres 作为埋点日志存储和 OLAP 分析组件。
3.实时数仓建设
实时数仓选用 SLS+Flink+Hologres 的架构。数据模型分三层,ODS->DWS->ADS。ODS 层明细数据存储在 Hologres 列存事件表进行 OLAP 分析。DWD 层数据按照主题整合,构建可复用的 DWS 层,减少烟囱化。由于 Hologres 同时支持行存和列存,ADS 层指标数据直接输出 Hologres 行存表对外提供服务。


项目二 信息流广告监测及归因系统
技术栈:SpringBoot + kafka + Maxcompute + Hologres + Flink
项目描述:广告投放主要为各种信息流渠道和应用商店渠道,之前使用第三方平台对投放广告进行监测和用户归因。但是面临着很多 问题,比如归因准确性,数据安全和投放数据回收应用等问题,针对以上问题开发了自己的信息流广告监测和归因系统。
个人项目职责:
1.广告监测服务 目前主流的信息流广告商都提供了广告监测链接模板,使用该模板生成针对性的广告监测链接,广告监测链接的属性信息会带有渠道ID、广告ID、用户设备 MEI、用户设备指纹等信息。广告曝光和被用户点击时就会对广告监测服务发生请求。该服务使用 SpringBoot 开发,后端收到用户请求之后会对将请求数据发给 kafka。kafka 的数据会对接 Maxcompute 做离线 归因和 Flink 进行实时归因。
2.信息流广告数据对接服务 用户激活和注册数据也写入kafka,Flink 实时消费用户激活和注册数据之后进行实时归因,归因平台拿到两方数据后,通过 数据分析,将广告平台的数据跟用户行为联系起来,最终将归因匹配的结果上报给广告商。

案例展示

  • 埋点系统

    埋点系统

    用户行为日志收集和分析系统原来使用的神策数据提供服务,没有自己的离线数仓和实时数仓。但是在业务发展越来越多样化和用户量越来越大的背景之下,神策数据已经满足不了目前的数据需求。为了替换掉神策同时建设自己的离线和实时数仓, 开始了自有埋点系统和实时数仓的建设。

  • 用户画像系统

    用户画像系统

    用户画像系统包括:数据加工层、数据管理层和数据应用层。数据加工层整合了公司所有用户事实和各种维度数据并对之清洗和处理,数据管理层为业务层提供最基础数据能力,包括标签管理、标签分类、标签定义、标签生产口径等,数据应用层赋予了产品和运营人员标签的工具能力,聚合业务数据,用户分群和为业

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    2
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服