对国际物流来说,其单证种类繁多、同类单证版式多样、单证内容复杂,业务变化快,前前后后涉及上百种的单证处理工作。而且货物运输途径多个国家地区,货物经手多家公司,同类单证中混杂着多种语言、格式还不统一。随着业务的扩张发展,单证的复杂程度仍会持续上升。
上述的实际业务场景对智能文档识别技术提出了更高的要求,通用算法遇到这些情况效果会大打折扣,如何在复杂情况下保证识别准确率成为业界亟待突破的瓶颈。
相关的难点特征:
第一,混合多国语言
由于在同一页文档中经常出现多国拉丁字符混合、如英语西班牙语、英语德语、英语法语等非常相近的字符文字和语言的混合,这对于文档字符识别和语义识别,自动分类、信息准确抽取会造成很大的挑战。
第二,特殊字段解析
智能文档识别不仅是一个OCR文字识别的问题,更是一个语义理解的问题。对于国际物流文档,经常需要将大段收发货人描述中精准解析企业名称、地址、税号、邮编等字段,同时要求能够支持全球地址和特性字段,是NLP技术面临的难题。
第三,不规范复杂表格
国际物流单据上经常需要对批量货物进行描述,商品名称,海关编码,毛重,体积,包装形式和数量。多类型的字符信息经常需要在跨行跨列的不规范混合子表场景下要做到信息项目的准确数据结构还原,目前还没有特别成熟的通用技术方法。
第四,多场景、多任务交叉
对于国际物流跨公司跨实体的信息流运作过程,往往需要对多种表单整合识别、比对,最后形成确切的指令流程,这就需要在多场景的文档识别理解需求中建立起背后的行业知识图谱的支撑,才能有效完成批量任务级别高精准的实际业务落地。
以上这些问题和挑战都需要新一代的OCR和NLP多模态深度学习并结合领域知识图谱的应用形成更为智能的文档识别技术来解决,最终实现消除繁琐低效的手工数据输入、肉眼信息核对、大幅降低运营管理成本、提升服务响应能力的国际物流产业服务升级目标。
智能文档识别技术作为人工智能应用中商业推广落地较快的领域,正成为人工智能新基建落地应用的“头雁”,已成为人工智能新基建对外提供的重要智能化服务能力之一。人工智能融入实体经济的过程,也将为智能文档识别产业生态引入丰富的人才、技术、场景等要素。