PDF抽取表格

金融-股票 yuexiang

PDF无表格线和有表格线表格抽取 描述:从PDF中抽取无表格线表格和有表格线表格。上传PDF,对每一页利用ResNet进行图片分类,判断是否包含无表格线表格。然后对包含无表格线表格的页面,利用ALBERT进行文本分类,判断每一行是否属于表格,完成表格外框抽取。然后利用文字间隙和语义信息画表格内框线。有表格线表格采用Opencv抽取线条进行表格抽取。合并无表格线表格和有表格线表格结果作为pdf抽表结果。其中无表格线抽表经历了使用U-net进行像素分类,判断每一个点是黑色像素还是白色像素,进行画线;经历了使用Yolov3, Cornernet,Centernet等进行目标检测,采用目标检测的方...

PDF抽取表格
PDF抽取表格

书籍阅读系统

教育-语言学习 yuexiang

描述: 输入一本书,进行书籍链接,实体链接,句子链接。书籍链接会找到与书籍相关的infobox, 图片,实体关系,wordcloud, 电视剧,电影。实体链接会将书中实体链接到知识库。句子链接会将句子链接到相关的解析,赏析,名家评论,图片,翻译,新闻,视频。 标签: 爬虫,实体链接...

书籍阅读系统
书籍阅读系统
书籍阅读系统
------ 加载完毕 ------
联系需求方端客服