2022.03-2022.09 车载轻车机免唤醒持续聆听项目:意图识别分类
依托语音助手小艺,双全工场景下识别区分云侧、端侧意图和非意图。:
1. 文本预处理和特征构建:新增前后字符,将数字和符号替换成通用标识,提高模型泛化性。设计双向切
词方法,实现基于2gram + tf-idf 的特征构建。
2. 采用多模型对比训练,选择效果最好的SVM模型,准确率达到97%。在android上完成SVM推理,并将意图
分类模型部署到Android。
3. 针对多轮意图重入/追问,根据意图上下文联想,设计不同意图类型特征构建方案,避免模型强拒识。
智能手册项目:研发设计分层多级NLU理解
依托语音助手系统,为车主指南手册设计多级NLU理解方案,完成用户智能问答。智能问答NLU环节的流程主
要包括:实体识别与匹配、问题关系匹配、语句查询和推理。本人主导多级NLU理解:
1. 多级规则匹配方案:先基于权重的实体匹配,再根据通用正则或个性化正则进行问题匹配,
2. QA pair 匹配方案:根据挖掘的数据,自动生成query对7k+条语料,构建共现词频+tf-idf+词向量的文
本相似度计算,并基于bert进行文本排序,离线模型的准确率从86%提升到97%
3. 知识图谱方案:基于neo4j构建知识图谱,设计基于模板匹配的知识图谱问答系统,输出智能问答demo。