内容:
该项目提出了一种基于稀疏判别分析和神经网络的高精度语音识别技术。主要分为两
个方面,即语音识别中的特征提取和语音识别系统的搭建。主要具备的功能是对于语音识别模型的搭建、训练和测试,实现通过训
练完成的语音识别模型对传入的语音进行文字化的转化。
业绩:
在此项目中采用稀疏判别分析(SDA )来进行特征提取。相较于传统的线性判别分析(LDA),SDA 通过引入 L1正则化,限制模
型参数的大小和数量,得到更具有稀疏性、鲁棒性和可解释性的结果。
在语音识别模型训练和语音识别系统的搭建方面,采用 Tensorflow.keras 框架并通过 DNCC+CTC 模型来进行训练,以提高语音
信号的识别效果。
同时,为方便用户使用,采用 PyQT5实现 GUI 界面,使得语音识别技术更加易于操作。