自然语言处理方面的,熟悉常用的分词,词性标注,命名实体识别模型。熟悉问答系统,包括意图识别,槽填充技术,基于知识图谱的事实类问答系统,以及基于排序机制的社区问答系统。
熟悉后台模块开发流程,基于spring的java后台开发经验。
数据分析,包括文本分类聚类,以及自动排序机制。熟悉lucene es等搜索引擎的应用
1、基于知识图谱的事实型问答系统:该系统主要针对音乐故事实现跨越两层关系的问答系统。知识图谱从关系数据库得到,利用d2rq做的映射,然后基于知识往外扩展模版构建sparql语句,作为模型的训练样本。预测阶段将用户自然语言转为sparql执行查询。
2、基于任务的对话系统,主要根据领域建立知识图谱,然后针对常用问法建立模版。并根据问法建立应答模块。考虑到一个任务的多个步骤建立上下文管理系统。