熟悉自然语言处理,在信息抽取方面有丰富经验,如命名实体识别,关系抽取。
编程语言: Python(熟练)、Java(了解)、C++(了解)
深度学习框架: PyTorch(熟练)、TensorFlow(了解)
其他: 图数据库 Neo4j(了解)
医学文本命名实体识别:
项目关键词:医疗文本,信息抽取,命名实体识别,BERT
• 项目目标:从电子病历中识别并抽取出与医学临床相关的实体提及,比如症状、检查检 验等。
• 结合数据情况和任务特点,在基于BERT的命名实体识别模型上进行优化,使综合抽取 效果在F1指标上提高了约5个百分点。
人物知识图谱项目:
项目关键词:知识图谱,信息抽取,命名实体识别,Neo4j
• 项目目标:对特定领域的履历文本进行要素抽取,并构建人物关系知识图谱,为后续任 务提供基础。
• 使用规则匹配、命名实体识别模型 BiLSTM-CRF 对文本进行要素抽取,抽取效果 F1 达到了0.9。并协助使用图数据库 Neo4j 构建图谱,使多层关系查询时间大幅缩短。