熟悉大数据集群搭建及维护;
熟悉Scala开发,了解Java,Python,R;
熟练Spark-SQL、Spark Stream开发;
熟悉Hadoop生态圈工具使用,包括:
1)Flume、Sqoop、Kafka等数据采集/传输工具;
2)MapReduce、Hive等数据处理工具;
3)HDFS、Impala、HBase、Redis等数据存储工具;
4)oozie、HUE等调度工具;
熟悉Linux开发环境,熟练掌握shell脚本开发;
熟悉MySQL数据库及其语法;
了解数据仓库方法论,软件开发方法论(测试、重构等)。
促销系统实时看板
开发时间: 2019.10--2019.12
项目架构: kafka + spark + Hbase
项目描述:
实时监测各个促销活动、各种促销形式的成本价值收益,为促销活动制定(哪些商品价格敏感?哪个地区人群价格敏感?哪些商品时令性强?对哪些商品采取促销?采用哪种促销形式?满减,满返,打折。采取多大促销力度能获取最大收益?在哪些地区加强地推力度?等等)及其他层级决策提供科学决策依据。
职责描述:
1.参与产品功能设计;
2.负责spark代码实现:在多个维度多个层级进行聚合分组;
3.数据校验;
4.功能测试;
5.对接java组。
数据360
开发时间: 2019/2-2020/1
软件架构: flume + hive + spark + Hbase
项目描述:
依托生产数据库,从数据应用角度切入,构建360°的数据全视图。
职责描述:
1.参与集群搭建,工具调研;
2.负责构建数据仓库:将生产数据转换结构,迁移到大数据集群;
3.负责应用层开发:按需求聚合数据,存储结果。
促销系统实时看板 开发时间: 2019.10--2019.12 项目架构: kafka + spark + Hbase 项目描述: 实时监测各个促销活动、各种促销形式的成本价值收益,为促销活动制定(哪些商品价格敏感?哪个地区人群价格敏感?哪些商品时令性强?对哪些商品采取促
数据360 开发时间: 2019/2-2020/1 软件架构: flume + hive + spark + Hbase 项目描述: 依托生产数据库,从数据应用角度切入,构建360°的数据全视图。 职责描述: 1.参与集群搭建,工具调研; 2.负责构建数据仓库: