熟练掌握深度学习算法:
transformer,transformer-xl ,bert,图卷积神经网络等最新算法,googleNet、resnet,desenet,paramid等CNN系列算法,LSTM、GRU、SRU、seq2seq等RNN系列算法,word2vec等词向量算法,attention mechanism,条件随机场,
熟悉文本分类、命名实体识别、关系抽取、情感分析等前沿技术
熟练掌握常用的机器学习算法:
线性回归,LR,KNN,SVM,DecisionTree,Bayes,K-means,bagging及boosting系列集成学习算法,潜在语义索引LSI,隐含狄利克雷分布LAD等主题模型以及特征工程PCA,SVD,TF-IDF等。
熟练掌握tensorflow,pytorch深度学习框架
熟练掌握python模块:numpy,pandas,matplotlib,scikit-learn,networkx
金融文本多标签分类
1. 整体概述:
由于君弘App有很多金融资讯,如果股民获得需要关注的信息往往需要浏览很多资讯,如果可以通过几个标签来窥探整篇文章的主题思想,那么将会大大提高股民浏览金融新闻的效率,项目共有1500个标签,采用了bert作为基本的特征提取工具,然后增加了cnn,senet block,残差网络,单层双向lstm等提高模型的准确率,最终模型的所有类的平均f1 为 96.52%。
金融新闻摘要自动生成
项目概述:
1. 整体概述:
互联网时代让我们对大量信息触手可及,我们的生活被信息过载的问题困扰着,所以,自动文摘变得越来越重要,自动文本摘要就是自动地把一段文字压缩为他对应的较短的版本的任务。项目采用的是抽取式的方法,以bert为基础,从原文本中抽取3句话,形成一段概括,在测试集上rouge1为56.71,1月初会应用在华西证券的算法平台上。
这个主要是智能问答,我在里面担任的是算法工程师,该项目准确率,线上达到98.57。本人精通各种自然语言处理工作
由于君弘App有很多金融资讯,如果股民获得需要关注的信息往往需要浏览很多资讯,如果可以通过几个标签来窥探整篇文章的主题思想,那么将会大大提高股民浏览金融新闻的效率,项目共有1500个标签,采用了bert作为基本的特征提取工具,然后增加了cnn,senet block,残差网络,单