上海交通大学在校研究生,系统学习过python编程,数据结构与算法,机器学习深度学习算法,概率与统计,熟练掌握python,做过一些项目,目前python 数据处理,机器学习相关算法,python爬虫都可以实现。
企业风控建模评分卡模型
前期独立完成6000多企业样本数据整合,将每个企业每个月月末数据作为一个样本点,处理缺失值、异常值,完成数据准备。并协助团队测试优化企业预警模型。
* 在测试的基础上,独立编写测试模型的自动化流程的python脚本,利用SQL语句关联8个相关的ebd数据表,直接执行python语句测试新的企业数据,简化繁琐测试操作流程,减少了操作执行的时间。
* 小微企业风控建模,采用评分卡模型,数据预处理主要根据实际情况和箱形图的数据分布,对异常值、缺失值进行处理,变量选择主要考虑了变量的分箱方法,根据分箱结果计算WOE值,检查变量之间的相关性,根据各变量的IV值来选择对数据处理有好效果的变量。训练LR模型调整参数,用ROC曲线对模型预测能力进行评估。计算测试样本中企业的违约率,通过企业的违约率给企业进行打分。