1、熟练掌握Python、linux以及Docker容器化技术。
2、熟练掌握自然语言处理领域的经典及前沿算法,包括但不限于tf-idf、word2vec、CRF、LDA、TextCNN、BERT、RoBERTa、GPT等等。
3、熟练掌握深度学习技术,熟悉各类神经网络的原理及实现,包括但不限于卷积神经网络CNN、循环神经网络RNN、注意力机制、Transformer等等。
4、熟练掌握PyTorch、ONNXRuntime等深度学习开发工具/框架。
5、熟练掌握机器学习相关算法,包括但不限于XgBoost、LGBM、聚类算法、SVD、PCA等等。
6、熟练掌握Flask框架的开发及优化。
1、基于AI算法(MacBERT)的文本内容审核:识别海量文本中的涉黄、涉赌等垃圾信息。
2、基于预训练语言模型的语义检索系统的设计与实现。
3、面向电商用户评论的高精度情感分析系统的设计与实现。
4、基于无监督学习的文本表示算法的优化及实现。
5、基于BERT-Sum的文本关键信息摘要系统的设计与实现。
6、基于BART模型的文本生成系统的设计与实现。