1.项目概况
实时财务重构指标计算系统是为亚马逊卖家提供商品,店铺实时日表和月表财务指标的实时数仓系统,经历了多个版本的迭代,从一开始的一小时延迟优化到现在的十分钟延迟。
该系统集数据采集,数据清洗与处理,数据挖掘,数据展示为一体,分为批处理和流处理两部分。
该项目包含4个分层:
a.ods层(canal+sparkStreaming+hudi(实时,sqoop(离线))
b.dwd层(sparkStreaming+hudi)
c.dws层(sparkStreaming+hudi,flink+hudi)
d.ads层(sparkStreaming+hudi+mysql)
◆ 2.我的责任
大数据平台架构设计、aws大数据平台组件兼容性测试、hudi源码改造、各个模块的通用性模块开发、帮助项目组成员提供开发方案和解决技术性问题、负责开发人员的代码检查工作,提供指导开发任务性能优化