本人提供基于python语言的AI语音识别、图像识别、人脸合成、C++底层通信、服务程序、音视频系统等开发,文档的编写,上述各种程序的API接口开发.本人善于沟通与交流,技术背景深厚,在实际的工作中具有丰富的产品规划能力。在技术层面对于基于音视频各种应用系统都比较熟悉,对于音视频系统开发很有经验。对于 AI 技术的数字人、人脸识别、语音识别、语音合成、图像识别等应用的前景比较看好。在以往实际的项目中比较关注各种 AI 技术的开源框架的发展。
1.K12中小学双师课堂项目
2.音视频系统后台管理系统。
3.基于瑞芯微3288体系的电子书包系统。
4.AI人工智能的人脸3D头像生成系统
5.AI人工智能的人脸换脸合成系统
6.AI人工智能的app客服问答系统
7.客服呼叫中心系统语音识别及转写服务.
8.语音识别助手系统.
9.智能语音会议系统.
10.语音识别系统便携一体机系列系统.
开发K12中小学双师课堂项目 其中包括基于 RK3399芯片架构的软件整体功能设计、基于 RK3399体系下的 Android 版本的双师软件整体架构设计、基于 RK3399体系下的 Android 版本的 USB 音频麦克风 NDK 驱动层设计及编码、基于 RK339
AI 语音识别是目前很多行业在应用的技术,其能将系统中采集到的人说话的语音片段或者语音文件经过转码压缩成指定的语音格式数据,然后提取语音数据的人声特征,对模型进行一定程度的训练,然后就可以达到适配大范围语音识别并整理成文字及材料的功能。AI语音识别需要大量的语音片段数据进行训练,