语音对话机器人算法引擎

基本信息

案例ID:196044

技术顾问:杨森 - 7年经验 - 百度

联系沟通

微信扫码,建群沟通

项目名称:语音对话机器人算法引擎

所属行业:人工智能 - 机器人

->查看更多案例

案例介绍

主要背景:应用于金融信审,获客与贷后等等场景下多轮无障碍机器人与用户语音对话。

主要内容:

参与并主导整个机器人语料,训练,预测等等平台与算法设计以及研发工作,算法开发框架tensorflow,keras,带领算法团队成员,研发的算法如下:

1.语音识别:有 vad ,声学前端采用将声音转为傅里叶变换的 mfsc 频谱图,识别模型为自主研发神经网络结构,包含残差结构,空洞卷积,ctc (不详说),该结构对真实口语化和噪声较大情况识别准确率高,语言模型为 transformer 算法。

2.语音合成:采用 tacotron2+wavernn 训练,并实现少量样本的语音合成及风格迁移。

3.意图识别(NLU):主要采用内部数据训练的 bert 经蒸馏后模型,模型压缩后速度能达到 ms级,模型小,识别速度快,适应线上。

4.情感计算:采用 gmlp 蒸馏训练,监控用户发生极端情绪后,采取人工快速介入安抚。

5.分布式多机多卡训练:采用100+ gpu 卡对大量语音语料进行分布式多机多卡训练。

6.其他NLP算法如:gpt的文本生成,bert+pagerank文本摘要,bert+crf实体识别,文本纠错,投诉倾向识别,知识图谱,关键词提取等等算法都有,就不一一赘叙。

上述算法,本人除为算法团队主要算法规划与设计人员以及团队负责人外,也是主要开发人员。

相似案例推荐

其他人才的相似案例推荐

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服