项目描述:该系统可以利用Rasa实现基础的多轮对话功能,可以识别语句中的意图和实体,可以利用正则表达式聚合训练样本、正确使用槽位、对中文以及英文语料进行训练、能集成Rasa和一些平台的IO。同时探索TTS语音合成方面的相关工作以及机器主播的合成方法。
项目进展:2020年11月能利用NLP技术中的CharRNN模型学习数万句古诗后能自动作诗,框架使用的是Tensorflow。初步实现了利用BERT进行指定语料的训练,并能对指定语料进行正向或负向的评价。12月熟悉了多盟SDK在安卓平台中的调用方法,了解了如何集成OAID。2021年3月能熟练使用Rasa中的run、train、shell、run actions、interactive等命令。能熟练解决安装mitie过程中的各种坑。为了获得足够的训练语料,利用selenium来对网站中的指定信息进行抓取,熟悉了xpath以及常用网页标签。初步分析了市场需求以及技术实现的可行性、搜集技术资料、寻找训练与测试数据、研究实现细节、攻克算法难题、环境配置与部署。目前已经打通主要技术关节、做出了几个子模块的Demo,正在继续进行系统优化。