熟悉Hadoop、Spark等大数据组件
熟悉Zookeeper、Kafka等分布式组件,并了解底层原理
熟悉JAVA、Python、Scala,理解高可用、高并发编程,JVM
熟悉Linux开发环境,熟悉Shell编程
精通常用数据库Oracle、Mysql、Gbase等,并曾使用过多种数据库。
熟悉Hbase、HIve表设计、数据转换
了解Flink技术
熟悉ETL熟悉转换技术
能够独立搭建技术框架,并按照Apache官网上的说明解决项目工程中问题
拥有快速学习新技术、新框架的能力
1、项目名称 基于大数据平台的ERP系统实时计算功能提升-设计开发实施项目
项目背景:
随着信息化建设和应用的不断深化,各类信息数据不断累积,量级数据不断攀升。导致越来越多的报表查询过慢,无法对海量的庞大数据进行统计分析。基于SAP HANA加速的各类ERP查询报表及应用也越来越多,HANA内存率不断提高。考虑到无法满足业务存储,急需应用大数据技术来改变现有的情况。
开发环境:Eclipse、SG-UAP、Linux(64bit)、JDK 1.6、Tomcat
软件架构: JAVAWeb+HDFS+Sqoop+Kettle+Flume+Kafka+MySql+PostgreSql+Hive+Hbase+Redis+Storm+Map/Reduce+Spark
工作任务:
在这个项目中,我主要参与了基于大数据平台内存计算组件实现ERP海量数据的在线计算、在线分析、基于HANA特性在实时运算研究,主要应用Spark、Kafka、Storm等计算技术进行实施和二次开发。
主要基于大数据技术提升了ERP系统实时计算功能,与南大通用公司的研发人员一起合作在原有的系统架构中开发构建了Gbase以及RTSync、Orato8A,实现并且优化了系统数据全量同步、实时同步、报表计算以及展现功能。采用Gbase8A技术(Mpp)代替Hive完成了内存计算,输出计算结果。
2、项目名称 统一数据中心数据仓库深化完善-设计开发实施项目
项目总金额:686.07万元
项目背景:
开展统一数据中心数据仓库深化完善,深化统一分析服务应用,为公司分析型应用提供高效的分析计算能力及统一的运行环境,支撑企业级大数据分析应用的全面开展。从硬件平台、关键技术组件等应用方面,研发相关监控运维功能,提升数据分析域技术运维能力。
开发环境:Eclipse、SG-UAP、Linux(64bit)、JDK 1.6、Tomcat
软件架构:Kafka+Storm+Mysql+Hive+Hbase+Redis+Mapreduce+PG+Spark
+Mahout+Yarn+Zookeeper+Gbase8A+Java web
工作内容:
在这个项目中,我主要负责处理海量数据,并进行相应的数据接口程序开发、底层、数据处理、数据库设计和前端页面模块的开发/维护工作。
完成情况:
优化并提升数据抽取、传输、存储以及计算能力。支撑了企业大数据应用的开展,并完成了数据平台及应用和所对应之模块的升级改造。
3、项目名称 分析与决策-运营检测(控)信息支撑系统-设计开发实施项目
项目总金额:10000万元
项目背景:
随着业务种类增多,应用系统也随之变多后数据来源及数据质量没有统一规范,导致后续整合难度大,统计分析无法反映出真实的生产情况提供运营支撑。为解决公司生产运营数据现象化、可查询以及可分析的工具平台规范统一,运营监控系统致力于促进规范化生产,提高数字化经营水平。
开发环境:Eclipse、SG-UAP2.8、Redhat5.5、JDK 1.6
软件架构:
HTML5、JSP2.0、JavaScript1.8、JAVAEE5.0、Weblogic 10.3.6.0、
Tableau9.1、Oracle
工作内容:在这个项目中我积极地和需求人员寻求沟通,摆平不需要的项目需求,并且对需求进行改善,也作为项目的主要负责人进行软件工程文档编制、代码调试、模块开发,页面改造、数据处理。