需求描述
语音交互模块研发,包括ASR(语言转文字)和TTS(文字转语音)功能
TTS要做到高拟人化,让用户察觉不出是在和机器对话(参考腾讯云“爱”系列音色)
ASR要支持对生僻词汇识别的优化,且尽量支持多种方言
ASR,TTS模块要求低延迟,支持本地化CPU部署
语音交互模块,会与公司已有大模型问答系统进行结合
人才要求
有语音交互开发、音视频开发经验。最好开发过ASR,TTS模块,有现成系统可以直接拿来用的
合作方式
远程、驻场、或远程+驻场均可
价格希望控制在几万元
如果你已开发过TTS系统,或有现成TTS系统可以使用,应聘时请附一段音频效果试听