参与大数据平台的搭建、数仓搭建、数据开发、存储过程、数据清洗、数据可视化开发;大数据组件:Hadoop + Hvie + Spark
+ Flink + Kettle + Spooq + Flume + Kafka + Rundeck + Redshift + PostgreSQL + Hbase。
IoT产业-空调 数据开发
项目架构:
● 采用Hodoop + Hive + SparkSQL + Flume + Kafka + Kettle + Redshift + PostgreSQL
项目描述:
该项目与公司的IoT产业空调系统结合,开发基于大数据的大屏、报表展示,项目使用了Hive、
SparkSQL技术,结合Hadoop、Flume、Kafka、Kettle等大数据组件,完成了基于Hive的离线数仓开发。
项目职责:
● 参与需求评审,了解业务需求;
● 根据需求进行数据探查摸底;
● 使用Kettle采集Mysql业务数据库数据到Hdfs中;
● 基于Hive离线数仓开发,离线数仓分层为:ODS、DL、DW、DWS、ADS层,对ODS层数据进
行清洗、脱敏;以及对DW层事实表进行聚合计算,完成设备新增、累计、活跃、设备转化率、TopN等指标的开发以及相应的存过过程;
● AIoTEdit和Hvie整合实现即席查询;
● 使用Rundeck进行Hive离线数仓定时任务的调度。
公司数据可视化案例的开发过程以及一些数据可视化案例的展示,主要是分析各设备的地区占比的情况,设备品类分布的情况等等指标的展示。
参与大数据平台的搭建、数仓搭建、数据开发、存储过程、数据可视化开发;大数据组件:Hadoop + Hvie + Spark + Flink + Kettle + Spooq + Flume + Kafka + Rundeck + Redshift + PostgreSQL +