1 熟悉java、 python开发语言, 可以开发一些后端程序, 熟悉 Spring, Hibernate, Mybatis, Spring MVC, Jquery, Maven ,Freemarker 技术, DUBBO 分布式服务框架,等基础程序框架
2 精通基于java的搜索系统开发, 精通Solr 源码、ElasticSearch, lucene源码。 可搭建搜索引擎以及进行二次开发。
3 熟悉大数据开发, 熟悉Hadoop、 Spark、 Zookeeper、Hive、Impala等大数据生态框架, 可以独立大数据系统的搭建、BI系统开发。
4 熟悉机器学习相关开发,可以基于机器学习结合大数据进行模型训练、预测等。
1)企业征信平台
项目描述:此项目主要为客户提供一个查找企业信息的平台 。
采用 Maven + Dubbo + Spring MVC + Mybatis + Freemarker + Solr + ActiveMQ + Memcache
2)企业图关系系统
项目描述 : 对Neo4j 图形数据库的高可用负责均衡搭建, 实体之间设计, 数据的导入, 嵌入式模式的编写, 图数据的挖掘。不同的企业之间需要有一定连接, 公司内有投资方 ,投资人,有法人,有任职员工。 而公司与公司之间的关系一定是由这多个关系隐含的连接在一起。 而项目要做的就是能够将隐含的关系层层导出,给出一个最佳路线能够为企业与企业或个人之间搭建关系桥梁。 项目最终选型为 Neo4j 图形数据库对企业之间关系进行挖掘。并配合高可用负载均衡环境对数据高性能挖掘。
3)企业大数据平台
项目描述:企业信息存储数据庞大, 包括用户的个人信息, 公司信息. 存放在数据库中不利于数据分析, 以及为上层提供帮助等. 于是将大部分企业信息存储在Hdfs文件系统上, 用Impala Hive 等技术为分析人员提供数据统计. 同时还为上层Neo4j,Solr等提供基础数据, 用到Mapreduce, Spark 等计算引擎从海量数据中计算, 聚合, 过滤, 连接等快速为上层提供数据源。
4)某网搜索平台开发
项目描述: 采用Lucene solr 技术, 为应用端提供主要搜索服务, 能够承受高并发。
5)ELK 平台的搭建与维护。
项目描述: 企业中的平台日志对企业至关重要, 如一个时刻对哪一个服务的访问量最大,网络负载的监控,用户群体的爱好。 初期日志堆叠了很多,采用ELK 技术对流量进行监控、索引、查询等。
6) 基于大数据的故障诊断
项目描述: 原有的故障诊断都是基于专家经验判断, 受到人力以及经验的约束. 项目决定采用机器学习的方法对数据进行只能诊断. 采集到的风机的故障数据存储在Mysql中, 通过搭建大数据平台, 从Mysql中同步数据到大数据平台上, 基于Spark Mlib 模型训练. 再对实时流数据进行机器学习预测.
7) 游戏数据后台BI开发
项目描述: 负责游戏数据的 BI仓库开发, 涉及ETL 、 报表开发、调度器开发等。