具有丰富的自然语言处理专业知识,熟练掌握自然语言处理的常见任务,如中文分词、命名实体识别、关系抽取、文本分类、文本匹配等;
熟悉文本挖掘等相关技术,如分类、聚类、摘要、信息提取、关联模式分析等
具有知识图谱工程化落地的相关经验,如图谱构建、知识推理、基于知识图谱的问答等
熟悉深度学习框架TensorFlow,了解Keras和pytorch,掌握深度学习模型训练及工程部署;
熟悉经典的神经网络,如CNN、LSTM、Transformer,以及图神经网络,如GraphSAGE、GCN、GAT等
熟悉使用python进行开发,如需工程需要也可以用java进行开发
金融知识图谱项目:
对非结构化的文本数据(如新闻、年报等)进行清洗,从文本中抽取实体、关系及属性,根据相关业务需求构建企业金融知识图谱;
行政处罚问答系统:
对公开的行政处罚文书进行结构化处理,构建行政处罚领域知识图谱,并在此基础上开发行政处罚问答系统,其中包括KBQA及任务型QA;
眼科知识科普检索系统:
基于上万条眼科知识QA问答对构建的知识检索系统(IR),供患者使用,整个技术架构包括问句重写、情感分析、字面匹配、问句匹配等;
风险视界是一款面向股权投资领域的数据分析平台, 能够协助用户基于多维度信息对相关公司、人物、 投资机构、投资事件等进行结构化数据分析。在此产品中本人主要负责自然语言处理及知识图谱的构建。自然语言处理主要是从原始数据中进行信息抽取,包括公司、人物及其之间的关系,然后用结构化的数据构
爱尔眼科智能客服旨在为大众科普眼科知识,以及为患者提供咨询服务。本人主要负责整个系统的技术架构以及后端开发,其后端核心是构建一个智能检索IR系统,主要涉及到的技术有情感分析、错别字改写、语义相似度匹配