基本信息

案例ID:187701

技术顾问:chf - 5年经验 - 腾讯

联系沟通

微信扫码,建群沟通

项目名称:nuoya

所属行业:人工智能 - 其他

->查看更多案例

案例介绍

项目概述:从pdf格式的年报中抽取出年报所涉及的公司以及公司的主营业务,从年报中的图表中抽取出公司的营业收入
构成表,统一将最终提取到的信息存库,用来对公司年度状况进行分析,并且提供公司年报数据给有需求的公司。

负责板块:
1.将pdf格式的年报数据进行转化,转化成txt格式的年报数据;
2.从转化好txt格式的年报数据中抽取出公司以及公司的主营业务;
3.从年报中的图表中抽取出公司的盈亏状况,并将所有信息入库。

技术方案:
1.利用OCR模型将pdf格式的年报数据转成txt格式(OCR模型可以高效的解析出pdf文件中的图片与表格);
2.应用BERT+bilstm+crf模型抽取出公司名以及公司的主营业务
3.利用规则从OCR输出的图表中匹配出公司营业收入构成

相似案例推荐

其他人才的相似案例推荐

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服