熟悉语言:C++,SQL,Python,Matlab。
研究方向:机器学习算法,谱聚类算法,数据挖掘数据清洗,基于深度神经网络得图像识别。利用训练集与测试集来训练机器学习模型的分类算法,如Svm,KNN,逻辑回归,随机森林,Xgboost。基于正则化的分类算法。本人研究的矩阵补全在网络链接预测中的应用,利用正则化方法与核方法求解预测问题,将投稿于《计算机工程与应用》。
kaggle泰坦尼克幸存者预测比赛,首先对数据预处理和画图研究不同属性对结果的影响。进而通过应用xgboost算法和特征工程,以及sklearn中的分类器,在11000支队伍中排名867,比赛成绩top8%。