1、熟练使用java、scala、python、R等开发语言,以及Shell脚本的简单编写;
2、熟练掌握hadoop、spark分布式数据集群的搭建和配置,熟悉linux操作系统;
3、熟练MapReduce、Spark等分布式计算框架、熟悉hdfs处理问题的思想;
4、对Hive、Hbase、Kafka、Solr、Elasticsearch等有一定的理解和应用能力;
5、熟悉Mysql、Oracle等数据库,熟练使用Eclipse、Maven、Git等开发工具;
6、熟练使用SpringBoot、SpringMVC、Hibernate、Mybatis等开源框架;
7、具备良好的编程和文档写作及管理习惯,有一定的需求分析、程序设计能力
项目1、机票大数据采集与分析系统
描述:通过市场价格采集系统为航线或运价人员提供可靠、及时的竞争对手数据源和基本分析工具,使市场策略的制定更加科学,效果更加有效,响应市场更为及时;并通过市场价格采集项目搭建国航大数据平台。
职责:
1)参与分布式集群搭建与维护;
2)每天定时采集机票定价信息;
3)数据清洗并存储到Hbase集群;
4)基于Hive做离线分析,结果导入mysql;
项目2、网安大数据舆情分析系统
描述:在当前互联网日益普及的情况下,网络信息的获取和发布也变得越来越方便,如何对网络信息的识别和监管就变得十分重要,通过构建网安大数据分析平台对可疑信息提供有效的防控方案。
职责:
1、 负责分布式集群的搭建及维护,对已有历史数据进行清洗过滤,并用solr创建索引;
2、 利用机器学习算法对文档及音频数据进行分析(主要做特征提取、分类、内容识别等);
3、搭建web业务系统,提供统计信息的分类展示,以及文本及音频的条件检索;
智能中台项目主要为业务运营系统提供数据和技术支撑。依托于大数据计算平台,智能为业务前端提供精准业务数据,以便其更智能化的开展运营工作。 该项目主要采用java web技术开发,使用最新流行的spring boot开源微服务框架
借助于计算机软件,帮助企业财务部门更高效的开展内部审计工作,主要功能包括基础资源管理,常用工作报表开发以及企业风控管控预报等