主要方向:自然语言处理(机器问答、机器翻译、文本情感分类、实体识别等序列标注问题)
其他方向:音频算法(主要指音频转频谱图后的人工智能算法)
熟练使用 python、c、p y torch、m x net
1. 军事领域自动问答系统(长文档,多文档,多跳推理)
2. 网文小说领域文档翻译系统(术语识别、术语翻译、文档级领域自适应翻译)
3. 各类比赛top,主要涉及:文本匹配,序列标注、机器问答等
该作品涉及NLP中大部分领域,包括前期爬虫,术语识别(NER),术语翻译(MT),术语对抽取(跨语言问答)等,模型使用bert、gpt2、bart等多种融合,并针对实际情况应用pseudo attention等对seq2seq框架进行改进。
主要为ES(elasticsearch)返回的多篇文档进行问题的精确答案抽取。包括多篇长文档的处理,推理性问题的处理,多答案问题的处理等,