➢ 语言: 熟悉 Python、 Java 语言并结合 Linux 系统、 shell 脚本、 SQL 语句进行开发和部署。
➢ 算法: 熟悉聚类、分类、相似文本、序列标注等常用的机器学习、深度学习算法, 熟悉 FAQ 问答系统、 特定场景聊天机器人
的搭建。
➢ 框架: 熟练使用 Flask、 TensorFlow 框架开发和部署, 了解并使用 SpringBoot、 PyTorch 框架开发和部署。
➢ 数据库: 了解并使用 MySQL、 Redis、 MongoDB、 Neo4j 开发和部署。
➢ 工具: 熟悉使用 Postmen、 XShell、 Navicat、文本数据标注等工具
银行数字人对话语料泛化算法服务 负责整个算法服务开发部署 2022.03 – 2022.04
项目概述: 在对话语料少的情况下,为业务人员整理的话术生成多条相似话术, 也就是相似问题的生成任务。
所用算法: 同义词库、 word2vec、 SimBert。
开发环境: Anaconda、 Flask、 Python3、 TensorFlow。
➢ 智能交互、智能质检平台 负责项目算法部分开发部署 2021.06 – 2021.09
项目概述: 智能交互平台实现了 robot 的快速配置搭建, 搭建的 robot 可根据不同对话场景的模板实现不同场景的对话,可实现单
轮、多轮对话。 智能质检平台实现了对话内容的检查,可配置不同的检查规则等。
所用算法: TF-IDF、 二分 K-Means、 word2vec、 SimBert, TextCNN、 BiLSTM+CRF、 GPT2、 关键词库。
开发环境: Anaconda、 Flask、 Python3、 TensorFlow、 MySQL。
➢ 省法院信息化项目管理系统 负责项目算法部分开发部署 2020.12 – 2021.03
项目概述: 在该项目中独立完成可研方案查重、可研方案信息抽取与校对、合同信息抽取与校对等功能的开发。
所用算法: Word 解析工具、 文本结构化、 MinHash、 BiLSTM+CRF。
开发环境: Java、 SpringBoot、 OSS、 MongoDB、 Anaconda、 Python3、 TensorFlow。
➢ 文本勘误产品 负责项目部分算法开发 2020.01 – 2020.06
项目概述: 在该产品中参与字词语法校对算法调研。独立完成标点校对算法,产品官网: https://center-word.dacube.cn/#/official。
所用算法: BiLSTM+CRF、 BERT+BiLSTM+CRF、 语言模型。
开发环境: Java、 SpringBoot、 Anaconda、 Python3、 TensorFlow。
➢ 相似文本算法服务 负责整个算法服务开发部署 2019.10 – 2019.12
项目概述: 该算法服务封装了多个相似文本算法, 搭建方便使用快捷, 主要是为了计算查找语料库中的相似文本。 运用到公司的
数智融媒产品、贵州省网信办应急指挥平台项目、贵州省教育厅舆情项目。
所用算法: SimHash、 MinHash、 LSH。
开发环境: Java、 SpringBoot、 OSS、 MongoDB。
使用深度学习算法实现文本关键信息的抽取,可实现html, word,图片等输入的提取: 项目概述: 在该项目中独立完成方案的设计与实现、信息抽取与校对、合同信息抽取与校对等功能的开发。 所用算法: Word 解析工具、 文本结构化、 MinHash、 BiLSTM+CRF、B
➢ 文本勘误产品 负责项目部分算法开发 2020.01 – 2020.06 项目概述: 在该产品中参与字词语法校对算法调研。独立完成标点校对算法,产品官网: https://center-word.dacube.cn/#/official。 所用算法: BiLSTM+CRF、
认证,负责,总之就是很靠谱,合作很愉快!