熟练使⽤SQL、HQL,熟练使用Hadoop、MapReduce进行数据处理
熟练使用excel工具,熟悉各种函数,数据透视表等高级用法,获得MOS Excel Expert 2016 证书
较熟练使⽤python、numpy、pandas、scikit-learn、matplotlib、seaborn、NetworkX等工具
熟悉常⽤的机器学习算法,比如LR、SVM、决策树、随机森林、AdaBoost、XGBoost、PageRank等
在模型评价、模型选择⽅面有较丰富的经验;在图计算、社交⽹络分析⽅面有⼀定的经验
能较熟练地使用echarts进⾏数据可视化,具有较强的报告撰写能力
具备linux环境下的开发能力,能较熟练地使⽤用git等⼯工具
在量化投资、信贷领域有一定的经验
1、风控模型开发
1)针对⼩额信贷业务进⾏风控模型开发、测试和优化,使⽤内部采集的⽤户数据及对接的第三⽅数据,构建诸如评分卡、RF、XGBoost等模型,迭代近10次,贷后效果稳步提升,7天逾期率下降约 5个百分点
2)为应对进件量受⼈工审核能力(约每⽇300单)的限制,建⽴全⾃动审批流程,每单仅需不到1s,处理效率远超⼈工,且贷后效果优于⼈工两个百分点
3)使⽤NetworkX对⼏⼗万条⽤户通讯数据进行社交⽹络分析,助⼒于发现中介和团伙诈骗
4)对线上不同节点的模型从通过率逾期率等⽅面进行纵向及横向的对⽐,跟踪线上模型的实际效果
2、基于⽤户⽣命周期的⾃动运营系统
1)提出了⼀种以用户投资周期为基础的⽤户分类方法,将有效用户状态划分为四类:活跃、平稳、消极、沉寂,并根据用户所处的状态实施不同的针对性运营策略
2)基于此⽅法进行A/B test对⽐实验,验证了方法的有效性;后全面推⼴实施,据运营部门反馈对⽐以前每⽉能节约2/3的成本
3)此⽤户分类⽅法能⽅便地和其他维度交叉,应⽤⽅式灵活,既可以指导投资端做精细化运营也可以预测平台投资额,为资产端提供决策依据
4)此项目已申请国家专利,专利号:2017109091476