大数据:
1、熟练 Hadoop 生态圈,如 HDFS, Yarn, Spark, Hive, HBase,Zookeeper, Kafka等。
2、熟练使用 Python, Hive 的完成开发工作。熟悉 Spark-Streaming流式计算。
Java相关:
1、使用 Spring Boot, MyBatis 框架,完成电力数据的推送。
2、熟练使用 Idea, Git 开发工具,熟练掌握 Hive SQL 语句编写,有 Oracle 数据库的开发经验。
味全云数仓项目
项目描述:使用腾讯的 EMR 集群,构建味全的云数仓项目,打通多个数据源,实现云数
据仓库的构建。
相关技术:Hive, Presto, Python, Shell, Spark 等
项目职责:
1、 数据接入 ODS,以及数仓中各层(DWD,DIM,ADS)的 ETL 清洗;
2、 将工作流程整理成规范型的操作文档,形成指导手册;
3、 和味全进行业务沟通,数据的校验,标签上线。
上海市异常电力统计项目
项目描述:使用 Spark 实现上海市的异常电力数据统计,并推送数据到数据中台。
相关技术:Spring Boot, Spark, Scala, Shell 等
项目职责:
1、 通过 Spark 计算上海异常电力的数值,并实现 Oracle 校验数据;
2、 将业务知识形成脑图,便于操作;
3、 通过 Spring Boot 调取 API 推送数据到数据中台。