从事大数据相关开发工作8年,熟练掌握大数据平台的搭建运维以及各种组建的使用,擅长离线Hive开发,数据仓库从0-1,Spark的各种应用,包括Spark 底层Api、SparkSQL、SparkStreaming对接kafka等,熟练操作HBase、ElasticSearch,以及两者联合使用(es作为hbase的二级索引等),熟悉Flink相关应用开发,利用Flink+Kafka实现实时数仓等
1.数据仓库从传统SQLServer迁移到大数据平台,包括整个集群的搭建运维以及离线数据仓库从0-1整个实现;
2.使用java实现从Kafka实时消费数据,写入明细数据到HBase,并将部分字段写入ElasticSearch实现HBase二级索引,最终达到数据实时查询,实时统计等功能;
3.使用flink cdc实现数据在kafka中构建实时数仓,做相关指标统计等。