金融研报文本信息抽取

基本信息

案例ID:167362

技术顾问:王二 - 4年经验 - abc

联系沟通

微信扫码,建群沟通

项目名称:金融研报文本信息抽取

所属行业:人工智能 - 其他

->查看更多案例

案例介绍

项目简介:抽取对应实体识如(转让人,受让人,转让价,成交价,日期等),文本中使用基于BERT的序列标注模型,定制化实体识别;
个人职责:负责样本预处理,模型的训练及评价,基于tensorflow搭建网络模型,模型结构基于 BERT+BiLSTM+CRF,模型训练,模型的预测和评价。
所用技术:
1. 样本预处理,使用gensim和sklearn对应工具包进行样本清洗和初步分析,对样本去停用词等清洗工作,将处理过的样本转成bert的输入格式,存为tf.record序列。
2. 使用tensorflow提供的TPUEstimator,基于BERT开源代码和中文模型,定制自己的model_fn。
3. 使用BERT最后一层的输出,接入BiLSTM+CRF层,最终测试集整体准召率均达到85%以上。
4. 用规则进行后处理修正模型部分可控错误,以及关系映射。

相似案例推荐

其他人才的相似案例推荐

  • 网页数据爬取

    网页数据爬取

    使用python网络爬虫技术,完成对各种网页的基本信息的爬取

  • 情指勤指挥系统

    情指勤指挥系统

    该系统主要用于公安局情报指挥中心。与其他系统一起支持警情处理

  • 智能审讯系统

    智能审讯系统

    系统主要面向公安法制、刑侦、学校、科研机构等部门,围绕办案审

  • 声电成像特征识别

    声电成像特征识别

    地质声电成像特征识别:高导缝、高阻缝、诱导缝、微小裂缝、层理

  • 声电成像修复

    声电成像修复

    1、地质声电成像修复:修复空白带、异常特征区域 该项目全由

  • 4路1080P车载MDVR

    4路1080P车载MDVR

    1,采用mc6630的主芯片 2,4g域格模块 3,最多

  • 人脸识别

    人脸识别

    光学元器件选型,镜头设计; matlab 仿真图像,对图像

  • 工业相机ISP

    工业相机ISP

    ISP算法开发,仿真及C++实现,包括但不限于镜头阴影、镜头

  • 工业相机ISP

    工业相机ISP

    ISP算法开发,仿真及C++实现,包括但不限于镜头阴影、镜头

  • 工业相机ISP

    工业相机ISP

    ISP算法开发,仿真及C++实现,包括但不限于镜头阴影、镜头

  • 停车场管理系统

    停车场管理系统

    系统架构:springboot,mysql,mybatisp

  • 国开云课堂

    国开云课堂

    国家开放大学学习网云课堂,集中展示国开学习网各种课程,并提供

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服