拥有多领域的技术能力,涵盖了自然语言处理(NLP)、计算机视觉(CV)和网络爬虫等方面。在NLP方面,熟悉文本预处理、词法分析、情感分析、命名实体识别以及机器翻译等技术,能够处理和理解各种语言文本。在CV方面,掌握图像处理、特征提取、目标检测、图像识别和图像生成等技术,能够实现图像的分析和理解,如人脸识别、物体识别等。此外,还具备网络爬虫技术,能够编写爬虫程序,从互联网上抓取和提取数据,并进行数据清洗和分析。技能能够应用于各种场景,如自动文本摘要、情感分析、图像分类、物体检测、数据采集和挖掘等任务。
医疗机器人Python
开发技术:机器人框架API接口技术ASRTTS等
项目介绍:此项目主要面向患者,提供寻诊、问诊、导诊、食物推荐、闲聊功能。该项目包括前端和后端两大模块,前端主要包括可视化语音录制以及回复系统,后端主要包括ASR,连接器,机器人逻辑,知识图谱,TTS等。
项目职责:机器人语料、意图识别、实体提取、ASR等
意图识别
开发工具: python、neo4j
开发技术:三元组抽取、实体识别、前端接口开发等
项目介绍:通过搭建医疗知识图谱,为机器人的搭建提供数据基础。该项目主要分为两个阶段,第-个阶段主要进行数据处理,医院收录10万文本数据,网上收录20万半结构化数据,实体量级30多万个,关系大约110万个,其中3万文本数据和5万半结构化数据是手工标注的,最终通过三元组抽取,做成30万结构化数据,其中三元组抽取精度是95.3%第二个阶段,主要是数据导入,导入的方式是将第一个阶段获得的三元组数据制作成CSV格式文件并使用NEO4]数据库命令导入。后期增加了该知识图谱的API接口。
项目职责:数据处理,将数据处理成结构化数据、三元组抽取、实体识别等
tts混合语音输出系统
开发工具: python. flask
项目介绍:项目主要目的是解决当前国内语音系统TTS普遍面临的中英文混合输出问题,目前国际上有将字符直接对应音素的方法(PPG),但该方法缺陷较大且仅有71%的精度,所以本项目采用相对位置关系来定位不同语言,通过分离+定位的方法解决了多种语言混合输出问题。具体步骤是先进行文本分离并记录不同语言的相对位置关系,再通过不同语言模型将文本转译成对应语音,然后使用相对位置关系再合成的方式获得混合语音的过程。
创新点:开创性的使用分离+相对位置关系+再合成的方式解决混合语音输出问题
项目职责:整体项目研发、前端、后端,部署等