熟悉机器学习、数据挖掘算法,如随机森林、SVM、GBDT、聚类算法、以及做过文本处理等相关项目。熟练使用 tensorflow 深度学习框架以及 pandas、scikit-learn 等基本机器学习库。
熟悉 python、 C 语言
➢ 根据航班历史数据以及气象等数据进行飞机额外油预测。
(1) 对数据进行预处理,特征选择
(2) 用随机森林、 神经网络进行有监督学习实现飞机额外油预测
根据法律文书中的案情描述和事实部分进行法条推荐与案件类型预测。
(1) 用 LSTM 网络加 attention 机制进行类别预测
(2) 用 TF-IDF 选取关键词,进行基于关键词近义词词频的类别预测
利用知识图谱的技术在台风新闻数据上构建数据库。
(1) 通过 BLSTM-CRF 抽取新闻数据中包括地点、 机构名、 台风名在内的实体
(2) 用 BLSTM-ATT 网络对新闻中的实体关系进行分类
(3) 用半监督方法抽取实体的属性