熟练使用多种编程语言:Python, Java, Matlab, C, Labview, C++, shell
熟练使用 Tensorflow, PyTorch, Keras, Sklearn等深度学习工具;可在Linux开发、熟练使用Latex、Markdown.
熟悉大语言模型、代码大模型、机器学习,神经网络、时序预测、自然语言处理(transformer、 bert等)、情感分类、图像分类、OCR识别等技术
1. 研发大模型、强化学习在金融保险的应用,已落地多个场景:具备数学专家能力的审计数字员工、e办智脑问
答系统(类kimi)、建设太保知识库问答系统框架(RAG toB)并赋能6个业务的领域智能问答。相关专利2篇。
2. 参与华为轻车机HiCar研发,从0到1实现HiCar持续聆听的多意图分类、多模态拒识模块并上线,相关成果申请
专利 1 篇,获得华为“CBG英雄连队”荣誉。
3. 华为车载智能手册:依托语音助手系统,研发分层多级NLU理解方案,包括实体识别与匹配、问题关系匹配、基于
知识图谱的语句查询和推理,为用户查询车载手册提供智能问答模式。获得华为“明日之星”荣誉。
4、网易有道 同声传译文本润色:将ASR文本进行大小写判断和标点标注。复现微软2017LSTM联合训练标点和大写的标注
文章,并改进为 BiLSTM+CRF+POS模型。准确率提升5个点。
2022.03-2022.09 车载轻车机免唤醒持续聆听项目:意图识别分类 依托语音助手小艺,双全工场景下识别区分云侧、端侧意图和非意图。: 1. 文本预处理和特征构建:新增前后字符,将数字和符号替换成通用标识,提高模型泛化性。设计双向切 词方法,实现基于2gram +
车载语音助手系统:多模态拒识模块并上线车载轻车机 双工语音助手主要流程:ASR、NLU、拒识模块、对话管理;拒识模块作用是防误闯,提高意图识别准确率。 1. 从多维度抽取音频特征,并考虑样本数据的缺陷,完成构建特征工程,独立训练多种机器学习模型,模 型准确率从 86%提