熟悉Python及常用数据分析算法(回归、聚类、决策树、GBDT、 xgboost、CNN、RNN等)
熟练使用SAS
熟练使用SQL,熟悉SQL Server,DB2,Mysql
熟练使用ETL工具(SSIS)
熟悉数据可视化工具(SSRS)
熟悉OLAP数据仓库多维建模
2018年10月 – 2018年12月 长尾客户理财分析模型(逻辑回归及评分卡)
项目描述:
长期以来电话接通率低,客户响应率低一直是电话渠道业务部门开展营销活动,提升客户粘性等过程中令人头痛的问题,如何能精准定位目标客群,提高客户响应率,达到高质量的营销效果就成了本项目所需解决的问题。
项目职责:
独立负责数据准备,数据清洗,变量规约,通过卡方检验,变量聚类,IV值从1000多个变量中初步筛选一批表现比较好的变量,然后通过检查方差膨胀因子(VIF)及相关性系数进一步消除多重共线性,最终采用逻辑回归及评分卡模型将客户购买理财产品的概率转换为评分。
项目业绩:
模型准确度达到82.5 %,AUC 0.84,业务营销成功率从不足1%提高到6%以上。
2018年4月 -- 2018年6月 客户评价文本分类(CNN)
项目描述:
在技术支持项目中,满意度是很重要的一个指标,我们也本着消费者至上的信念希望能够更好的帮助消费者解决问题。通过分析帮助业务部门定位出客户对服务过程中较为不满的问题,然后解决这些问题以提高客户满意度。
项目职责:
独立负责建模,采用CNN模型,利用Tensorflow模块,经过embdding,convolution,pooling,然后利用softmax classifier进行分类。
项目业绩:
模型准确率达到83.2%, AUC 0.85较为理想效果,有效的帮助业务部门定位出客户服务过程中存在的突出问题。