ID:282155

支足常乐

自然语言处理工程师

  • 公司信息:
  • 北京环球医疗救援有限责任公司
  • 工作经验:
  • 1年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 北京
  • 丰台

技术能力

数据标注,ner标注,分类标注,图片标注
扎实的编程语言 Python;
 熟悉深度学习(CNN,RNN,LSTM),
 理解常见机器学习算法(LR,DT,SVM)的原理;
 熟悉自然语言处理常见算法(HMM, CRF,Transformer,Bert)等 nlp 算法模型。
 熟练运用相关工具库(NumPY,Pandas,Sklearn 等)、框架(Tensorflow/ Keras 等);
 熟悉关系型数据库 MYSQL,图数据库 Neo4j;
 对自然语言处理相关的分词、词性标注、实体识别、文本分类等有深入的实践经验。
 参与或主导过知识图谱等 NLP 项目解决实际问题;
 熟悉运用 Scrapy,Selenium,CoolNERTool;

项目经验

医学知识图谱
技术要点:Bilst+crf,IDCNN+crf,neo4j
利用大量的结构化或非结构化精神疾病的医学数据,通过算法提取出实体、关系、属性等知识图谱的组成元 素,选择合理高效的方式存入知识库。并构建脑疾病领域专业的知识图谱。

材料分类,科室归类
技术要点:bert,albert,cnn
针对 2 万电子病历通过 OCR 对图片进行文字识别,并建立单标签多分类模型 bert 或 albert 识别出病历材料 并分出类别,准确度最终到 95%,同时对部分病历材料进行分段处理,之后对患者症状归一化对科室信息 9 分类,建立 textcnn 模型做预测,科室归类准确度 98%。

客户声音 VOC
技术要点:scrapy,LR,GBDT,textcnn,bilstm+crf
爬取各大网页上汽车负面数据,获取有关汽车的列表页和详情页,处理 5 万条短文本数据,搭建机器学习模 型LR 和 GBDT 效果分别做预测,准确度 76%左右后又对比深度学习模型 textcnn,准确度 99%。最终定稿 textcnn 模型实现客户需求预测出三级标签。对四级校验部位和五级校验问题实现 BIO 标注,对文本进行命名识别 实体,搭建 bIlstm+crf 模型,识别汽车的部位和问题准确度达到 90%以上,方便生产厂家更直观的发现和解 决汽车部分的问题,提高一汽汽车生产产量。

舆情监控系统
技术要点:albert+textcnn,多标签多分类
解决客户新需求,对 VOC 已有的 5 万条数据预测出三级标签后有在此基础上添加一列为六级标签,建立多 标签多分类模型预测出产品车型,企业形象,品牌销售及服务等 5 类别,负责模型搭建,模型训练及评估, 数据切分 8:2,最终效果准确度 80%以上。

智能录入系统
技术要点:信息提取,归一化,Levenshtein,bilstm+crf
基于 OCR 平台对病历图片进行材料上传,材料分类,清晰度效验,OCR 解析,对 11 类材料基于规则提取用 户患者的基本信息 20 个字段,准确度达到 90%以上。部分字段如医院名称,科室需要归一化,基于 OCR 识 别低错误高的材料现住址和户口地址字段提取调用 Levenshtein 相似度算法进行纠错,完善提取地址的准确 性。选用 bilstm+crf 针对部分医院门诊发票识别药品名,数量,规格,金额等等提升识别门诊发票的准确度 最终达到 95%。

智能理赔,智能控费
技术要点:核赔规则,scrapy,selenium
应用于医院,保险局,医保局及其他医疗保险行业。负责制定理赔规则;抓取各省市三大药品目录:药品 耗 材及诊疗,中国药典;基础知识库入库

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    1
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服