熟悉大数据仓库搭建,熟练使用 Hive、Impala,并有复杂 SQL 的优化能力;
熟悉 Hadoop 生态,如 MapReduce/Impala/Spark/Hue/Kafka/Flume 等;
熟练掌握 Java/Python/shell/JavaScript/SQL 语言;熟悉 Docker 容器技术;
项⽬描述:基于华为 Support ⽹站的⽤户⾏为数据,起初以 Oracle 数据库搭建数仓进⾏数据分析预研,确 定⽤户⾏为分析的价值后⽴项,⽽后迁移到 Hadoop ⽣态建设数仓搭建⽤户⾏为分析平台,经历了数据采 集、同步与更新、清洗、数仓建设、可视化及数据应⽤开发等阶段。