严格遵守PEP8代码规范
熟练掌握python语言,及python的开发.
熟悉Mysql数据库的基本操作
熟练掌握机器学习中Linear,Ridge,Lasso,Logistic等回归模型,随机森林,贝叶斯,决策树,GBDT等分类模型,对于Boosting类别的xgboost,lgbm,ada等模型的转换运用,Kmeans,DBSCAN等聚类算法
熟练掌握Hyperopt进行多种模型的参数调优及选择
具有很好的数据敏感度,对于数据清洗及特征工程具有自己的见解
<注汽锅炉的推荐燃流>
现场数据噪音较多,利用窗口滑动,Iforest异常值检测等多种技术进行数据的清洗及异常值的过滤
拟定方案,进行方案可行性验证
利用皮尔森系数进行特征选择,减小内存,提高精度
利用Hyperopt进行多种模型的模型选择及参数调优,选择最优模型