具备4年人工智能领域的工作经验,主要涉及图像识别和语音识别。
图像识别领域精通图像分类、目标检测、文字检测、文字识别等任务。
语音识别领域精通语音转文本、音频分类等。
精通python编程语言。
主导过的AI项目:
1. 身份证信息提取
2. 营业执照信息提取
3. 银行卡信息提取
4. 手写签名比对
5. 音频审核
通过PaddlePaddle框架复现了论文 Real-time Convolutional Neural Networks for Emotion and Gender Classification 中提出的两个人脸(性别、表情)分类模型,分别是SimpleCNN和MiniXce
跟音频处理相关的一些工具,持续更新。 目前已经实现了两个功能: 1. 音频格式的设置,比如改变采样率、采样深度等。 2. VAD (voice activity detection)。