1、扎实的javaSE基础。掌握并发包、多线程、nio等原理。
2、熟练掌握Hadoop集群搭建和配置。熟悉HDFS、MapReduce、Yarn、Shuffle原理。
3、熟练掌握Zookeeper集群搭建。熟悉ZAB协议、选举机制、分布式的数据一致性。
4、熟悉使用Flume进行日志收集。了解事务机制,会使用扇入流、扇出流和多级流动机制。
5、熟练使用Hive数据仓库、Hive调优。
6、熟悉Kafka消息系统。消息分区、副本机制和消息系统语义。
7、熟悉分布式数据库HBase。表设计原则、物理存储原理。
8、熟悉Storm实时处理系统。理解其拓扑结构及工作原理。
9、熟悉SparkRDD、SparkSQL开发及Spark作业调优。
10、熟练应用SpringMVC、Spring和Mybatis等主流框架,对底层代码有一定了解。
11、熟练掌握Mysql数据库、Mycat中间件, Mysql主从复制、读写分离,数据库的优化。
12、熟练使用Tomcat,Nginx负载均衡及反向代理机制。
13、熟练使用Redis集群部署,读写分离、分片和哨兵机制。
14、熟悉Linux系统的基本指令,会在Linux系统中部署主流应用。
15、能简单应用HTML、JS、CSS、AJAX、JSON、JQuery等Web前端技术。
16、了解一些基本算法原理。如岭回归、LAR、系统聚类、K-Means、KNN、贝叶斯分类等。
项目名称: 网站用户行为分析
技术选型: Hadoop、Flume、Kafka、Hive、HBase、Sqoop、Storm、Zookeeper、Mysql
项目描述: 用户行为分析是提升网站服务的重要手段。通过获取用户在网站的行为,可以分析出哪些内容受用户喜欢,哪些页面存在问题,从而使网站的改进具有一定的针对性。主要的统计数据有:页面访问量,用户访问量,页面会话数,跳出率,平均访问时长,访问深度等维度。
责任描述: 搭建Zookeeper集群对各个集群进行分布协调,实现集群的高可用。利用Flume收集页面的埋点数据,通过扇出机制将数据输出到Kafka中进行实时分析。Kafka将数据输入到Storm中,利用Storm的不同bolt组件对数据进行相关的业务处理,并将数据存入到HBase和Mysql数据库中,在前端页面进行可视化。
项目总结: 这个项目让我对大数据的整个处理流程有了清晰的认识,并将各项技术串联起来,以及如何对涉及技术进行相关的参数调优。
项目名称: 企业ERP管理系统
技术选型:Spring、SpringMVC、Mybatis、Mysql、Shiro、JavaScript、Ajax、Json
项目描述: 方便生产企业对各个部门之间的信息进行统一管理,信息资源集成化,实现信息共享、自动化办公和企业资源的综合利用。其中包括基础管理、采购管理、销售管理、仓库管理、生产管理、客户管理、财务管理、报表统计、系统管理。
责任描述: 负责报表统计及系统管理两个模块的设计与实现。报表统计能够让管理人员知道当前公司发展状况,并提供决策依据。系统管理模块通过\Shiro安全框架,对用户进行身份验证和授权。
项目总结: 通过这个项目加深了我对MVC三层架构模式及SpringAOP的理解,对Shiro安全框架底层原理实现有了更深入的了解。
项目名称: 合肥流金岁月商城
技术选型: SSM、Mysql、Dubbo、Redis、Quartz、RabbitMQ、Zookeeper、Mycat、Nginx、Solr
项目描述: 合肥流金岁月商贸有限公司为适应当前互联网商城发展的潮流,决定开发一个网上商城,进行各品牌儿童用品的售卖。其中包括后台管理系统、商品管理系统、Web管理系统、登陆管理系统、购物车管理系统、订单管理系统、支付管理系统、会话管理系统、用户管理系统。
责任描述: 主要负责购物车及订单管理模块的功能实现和设计。实现购物车模块跳转到订单模块,生成订单后跳转到支付模块。通过Quartz实现订单超时关闭交易,RabbitMQ消息队列缓解服务器压力。
项目总结: 通过这个项目让我了解了一个大型项目该如何去优化提升性能。对Dubbo微服务模式的优势有了更深的见解。要努力学习新技术,并将技术应用到项目中,提高开发效率和项目的高可用性。