吉利-三端适配的语音助理主要对吉利旗下的车机系统,魅族手机以及星际的XR眼镜等多款设备进行了适配。主要包括一套通用的语义理解框架和三方服务接口。覆盖了天气,音乐,导航,电话等多个垂域的功能。并且支持了语义拒识,多意图识别,和多轮对话模式。在本项目中,本人主要负责了整体架构的设计,主要包括三端对齐的意图体系定义,垂域多轮语义理解,中控-垂域多轮交互协议,多策略融合的中控仲裁架构设计,以及仲裁模型的优化等工作。截止2022年年底,新的架构体系实现了各模块的解藕,支持异步开发和独立上线,团队整体迭代效率提升200%。新的对话系统架构替换了冗余的对话管理模块,采用了小爱的轻量级的多轮交互协议,多轮对话意图识别准确率提升26%。针对中控仲裁模型的优化,本人落地了基于预训练模型的前沿技术方案,对比了百度,阿里,等讯等业界顶尖的技术方案。对比原来老的系统,仲裁意图识别准确率提升76%。