熟练使用Java Python 等编程语言,了解 scala。
熟悉Spring SpringBoot Mybatis等开源项目,能够合理进行技术选型,善于解决问题。
熟悉HDFS和MapReduce的实现原理,具有一定的Hadoop集群维护能力。
熟练使用Spark内存计算框架。
熟练使用MongoDB,Hbase等NoSql数据库以及Solr搜索引擎。
熟练使用Kafka Zookeeper等大数据框架。
熟练掌握Mysql关系型数据库,具有一定的Sql优化能力。
熟练使用kettle工具用于数据同步,并对job进行维护。
熟练使用ansible tower进行自动化部署任务。
熟练使用Linux系统及常用命令。
熟悉docker容器化技术。
项目:大数据基础服务设施建设
项目描述:该项目主要为公司搭建大数据基础服务平台,把数据存储到Hadoop分布式文件系统上,使用Saprk或Java程序对数据进行清洗工作,并提供对数据的实时同步,备份等服务。为风控以及报告业务提供API接口。
责任描述:
使用Java对MongoDB中数据进行ETL。
实时同步MongoDB上的数据到Mysql关系型数据库。
实时同步Mysql上的数据到Mysql。
提供操作Solr以及Hbase的各种API。
使用ansible进行自动化部署。
使用docker进行一系列测试工作。