熟练掌握python编程技术,有爬虫,数据分析工作经验,熟悉机器学习中的LR,SVM,聚类,随机森林等常见算法;熟悉深度学习中的rnn,cnn,lstm等神经网络;常见的数据分析第三方库pandas,numpy; 数据可视化库,matplotlib,seaborn,pyechars;爬虫框架scrapy,xpath,urllib;熟悉Linux命令,掌握git,svm等工具;对数据清洗,特征选择比较擅长,对于模型建立,参数调优有一定理解.
列车故障分析项目中,在大数据平台中,建立数据仓库,对数据进行清洗,变换,存入hbase数据库,整合列车故障数据,爬取对应线路的天气数据,以及工务数据。利用机器学习中的关联算法找出影响列车发生故意的特征因素,对列车的安全行驶提供保障