深度学习,pytorch、tensorflow、paddle、语音识别、语音合成、自然语言处理NLP、图像识别
1.掌握C/C++、Python、Shell、Go、GPU CUDA编程、Linux、Docker。
2.熟悉主流的语音识别框架和算法、能够运用相关工具和技术进行语音识别模型的训练和优化,使用过开源语音识别框架,比如whisper、funasr等。并对语音合成的原理和训练流程也有一定了解,复现过开源的合成项目,比如TTS-Transformer。
3.熟练使用多种深度学习框架:tensorflow、pytorch、paddle、mxnet、houyi;对不同框架的模型的互相转换有比较多的经验。
4.NLP、语音识别、语音合成、机器学习、深度学习。
(1)语音识别smlta2 01ctc切分模型优化
(2)语音合成csubgan研发、TTS-transformer研发