语言:python
方向:机器学习、自然语言处理
掌握深度学习算法RNN、LSTM、GRU、CNN等;
掌握Transformer、BERT以及BERT变体RoBERTa、BERT-WWM等;
掌握传统机器学习算法贝叶斯、决策树、随机森林、SVM、逻辑回归、Xgboost、聚类降维算法等;
掌握数据结构和算法,熟练使用linux系统,熟练使用pytorch、sklearn,熟练使用gensim、numpy、pandas、matplotlib等库。
1、搭建机器学习平台,应用于材料领域模拟机算;
1)平台接受数据采用excel格式,内部使用pandas处理数据;
2)平台包含数据预处理、特征工程、算法、模型复用模块;
3)传统机器学习算法使用sklearn,深度学习算法使用pytorch;
4)模型复用使用pickle模块保存并调用模型。
成就:平台已经得到较多的材料领域客户(3000+)使用,用户能够快速拖拽模块建立机器学习流程,部分客户使用此机器学习平台辅助发表论文。