开发环境:Anaconda3,PyCharm,rasa
项目背景:机器人作为人工智能发展的主要方向之一,而智能对话是机器人的重要功能之一。公司现有的2.0版本对话系统是通过模板来解析语意的,但模板有着编写困难,也难以维护等诸多缺点,所以公司决定以rasa框架开发3.0版本的多轮对话系统,通过机器学习的方法来实现自然语言处理任务。
项目责任:该项目我主要负责模型的搭建和训练工作。本项目采用深圳机场的数据作为训练语料。Rasa分为nlu和core 两个模块nlu负责语意解析,core负责生成对话。Nlu先有jieba分词,再用词袋模型生成词向量,再有crf抽取出实体,由EmbeddingIntentClassifier进行意图识别。Core通过识别出来的实体和意图还有上下文来生成对话。可以记录历史对话信息实现多轮对话。