应用统计(人工智能方向)硕士,系统学习了python数据分析,大数据统计建模,机器学习,自然语言处理,数据库等相关课程。用统计的知识进行数据分析,数据挖掘。会python,R,matlab,机器学习,神将网络深度学习。研究过python搭建的神将网络的超参数自动优化,可实现自动对建立的模型进行超参数优化,提高模型性能。能解决预测,情感分析,文本分析,图片识别等问题。
完成中海油ESP项目中油田数据的数据整合,数据清洗与处理;
对多文件的柴油机数据进行ETL;
完成数据不平衡问题的处理
使用sklearn中的机器学习模型,进行数据挖掘,并分析各模型在运用中的不足;
使用tensorflow与keras协助完成最终故障预警的模型建立与算法实现,并分析模型效果;
构建IPR模型,实现单井IPR曲线的自动生成。
参与中国杯国际足球邀请赛效益评估的问卷设计及数据处理
独立完成深度学习模型超参数自动优化的研究
第一张图情感分析模型的准确率曲线图,x为迭代次数,y为最终准确率,右图的y为模型的损失值。第二张图为模型结构信息,用keras搭建lstm的模型,各个模型超参数配置及模型信息。
图一为决策树的初步分类,对于设备故障进行分类,多分类问题,从中可知各个特征的重要性。图二为数据处理的可视化分析,因项目涉密,所以将具体数据及最终结果不予展示。
图一为预测的房价,最终模型拟合的r方值达到0.89。图二为数据各特征值的热力图,特征之间的相关性,相关度可视化。
图1为绘制的地图,根据经纬度在地图中自动标出数据中的各项。图二为用R绘制的词云图,上方为R的部分源码,下方为对应的词云图。