1. 熟悉Hadoop生态圈的各个产品如:熟悉hive、MapReduce、sqoop、zookeeper、flume、Yarn工作原理理及操作;
2. 熟悉关系数据库原理,熟悉oracle、mysql数据库的日常操作和维护;
3. 熟悉Java、Python等语言,能够熟练使用 eclipse 编写程序;
4. 熟练掌握各种SQL,包括常规SQL、HQL等;
5. 熟悉Linux开发环境;
1、从全国各地区门店收集数据到数据库中,导入到HDFS上,用map reduce和hive进行清洗和分析,得出结果,为业务部门和上级部门工作提供依据;
2、用上年度的个人借款信息数据,从职业、职位、收入水平、借款金额、房屋性质、出借次数几个维度分析借款人,从而为下次借款人借款做一个营销预测;
3、统计每日理财申请情况,每日现金流入情况,每日借出情况,为资金预算提供依据;
4、通过合作企业获得的征信数据来帮助本公司减少贷款风险;
5、通过网页的埋点数据、用户点击行为、trace跟踪的数据进行分析,得出每个潜在客户的对公司产品喜好,从而对这些客户进行精准的产品推荐;
6、根据逾期表和客户信息表分析优质客户群,提升或者降低贷款人额度;
7、通过对客户选择的贷款业务增量和理财业务增量分析,从而即使准确的抓住未来趋势,为客户提供更加优质的服务;
8、通过地区统计信用借款和财富管理投资总量,然后结合国家统计局p2p贷款公司总体效益,分析出公司的市场占有份额;