一种财务报销数据处理方法、装置及系统

阅读: 评论:0

著录项
  • CN202010068639.9
  • 20200121
  • CN111079755A
  • 20200428
  • 中央军委后勤保障部财务局
  • 施虹;宋利华
  • G06K9/32
  • G06K9/32 G06K9/62 G06Q40/00

  • 北京市海淀区复兴路22号院
  • 北京(11)
  • 20190726 CN2019106814720
  • 北京三友知识产权代理有限公司
  • 周达;刘飞
摘要
本说明书实施例公开了一种财务报销数据处理方法、装置及系统,所述方法包括获取待处理报销申请的报销凭证影像;根据确定的报销关键区域对所述报销凭证影像进行图像切分处理,获得所述报销关键区域对应的影像切片;对所述影像切片进行图像文字识别处理,获得所述影像切片对应的子结构化数据;将所述待处理报销申请的各影像切片对应的子结构化数据进行整合,形成所述待处理报销申请的结构化数据,根据预设校验规则对所述结构化数据进行校验;调取校验结果中不满足预设要求的子结构化数据对应的影像切片,以对所述结构化数据进行修正处理。利用本说明书各个实施例,可以大幅度提高财务报销数据处理的效率,降低财务人员的工作量。
权利要求

1.一种财务报销数据处理方法,其特征在于,包括:

获取待处理报销申请的报销凭证影像;

根据确定的报销关键区域对所述报销凭证影像进行图像切分处理,获得所述报销关键区域对应的影像切片;

对所述影像切片进行图像文字识别处理,获得所述影像切片对应的子结构化数据;

将所述待处理报销申请的各影像切片对应的子结构化数据进行整合,形成所述待处理报销申请的结构化数据;

对所述结构化数据进行校验,调取校验结果中不满足预设要求的子结构化数据对应的影像切片,以对所述结构化数据进行修正处理。

2.根据权利要求1所述的方法,其特征在于,所述对所述报销凭证影像进行图像切分处理,包括:

对所述报销凭证影像进行类型识别处理,获得所述报销凭证影像的凭证类型;

根据所述凭证类型确定所述报销凭证影像对应的图像切分算法,利用所述图像切分算法对所述报销凭证影像进行图像切分处理。

3.根据权利要求1所述的方法,其特征在于,所述对所述结构化数据进行校验,包括:

获取所述待处理报销申请的报销类型,根据所述报销类型确定所述报销凭证影像对应的校验规则;

根据所述对应的校验规则对所述结构化数据进行校验。

4.根据权利要求1所述的方法,其特征在于,所述对所述影像切片进行图像文字识别处理之后,还包括:

若影像切片识别失败,则将识别失败的影像切片作为待补录影像切片;

将所述待补录影像切片分配至至少两个补录终端进行补录处理,获得所述待补录影像切片对应的至少两个补录数据;

对所述至少两个补录数据进行一致性校验,当校验结果满足要求时,将所述补录数据作为所述待补录影像切片的子结构化数据。

5.根据权利要求1-4任一项所述的方法,其特征在于,所述方法还包括:

将审核通过的待处理报销申请的影像切片以及影像切片对应的结构化数据更新至报销样本集;

利用更新后的报销样本集对图像切分处理及图像文字识别处理对应的机器学习模型进行更新处理。

6.一种财务报销数据处理装置,其特征在于,所述装置包括:

数据获取模块,用于获取待处理报销申请的报销凭证影像;

图像切分模块,用于根据确定的报销关键区域对所述报销凭证影像进行图像切分处理,获得所述报销关键区域对应的影像切片;

图像识别模块,用于对所述影像切片进行图像文字识别处理,获得所述影像切片对应的子结构化数据;

数据校验模块,用于将所述待处理报销申请的各影像切片对应的子结构化数据进行整合,形成所述待处理报销申请的结构化数据,并对所述结构化数据进行校验;

数据调取模块,用于调取校验结果中不满足预设要求的子结构化数据对应的影像切片,以对所述结构化数据进行修正处理。

7.根据权利要求6所述的装置,其特征在于,所述图像切分模块包括:

凭证类型确定单元,用于对所述报销凭证影像进行类型识别处理,获得所述报销凭证影像的凭证类型;

图像切分单元,用于根据所述凭证类型确定所述报销凭证影像对应的图像切分算法,利用所述图像切分算法对所述报销凭证影像进行图像切分处理。

8.根据权利要求6所述装置,其特征在于,所述数据校验模块包括:

校验规则确定单元,用于获取所述待处理报销申请的报销类型,根据所述报销类型确定所述报销凭证影像对应的校验规则;

数据校验单元,用于根据所述对应的校验规则对所述结构化数据进行校验。

9.根据权利要求6所述装置,其特征在于,所述图像识别模块包括:

判断单元,用于判断影像切片是否识别失败,若影像切片识别失败,则将识别失败的影像切片作为待补录影像切片;

补录单元,用于将所述待补录影像切片分配至至少两个补录终端进行补录处理,获得所述待补录影像切片对应的至少两个补录数据;

校验单元,用于对所述至少两个补录数据进行一致性校验,当校验结果满足要求时,将所述补录数据作为所述待补录影像切片的子结构化数据。

10.一种财务报销数据处理设备,其特征在于,包括处理器及用于存储处理器可执行指令的存储器,所述指令被所述处理器执行时实现包括以下步骤:

获取待处理报销申请的报销凭证影像;

根据确定的报销关键区域对所述报销凭证影像进行图像切分处理,获得所述报销关键区域对应的影像切片;

对所述影像切片进行图像文字识别处理,获得所述影像切片对应的子结构化数据;

将所述待处理报销申请的各影像切片对应的子结构化数据进行整合,形成所述待处理报销申请的结构化数据,对所述结构化数据进行校验;

调取校验结果中不满足预设要求的子结构化数据对应的影像切片,以对所述结构化数据进行修正处理。

11.一种财务报销数据处理系统,其特征在于,所述系统包括至少一个处理器以及存储计算机可执行指令的存储器,所述处理器执行所述指令时实现所述权利要求1-5任一项所述方法的步骤。

说明书
技术领域

本发明涉及计算机数据处理技术领域,特别地,涉及一种财务报销数据处理方法、装置及系统。

在财务报销过程中,需要处理庞大数量的报销凭证,如发票、pos单等各类报销凭证。财务人员需要花费大工作量对各类报销凭证数据进行核对,同时,还需要人工录入大量的报销信息,使得整个报销过程复杂繁琐,工作量巨大。因此,本技术领域亟需一种可以更加高效的财务报销数据处理方法。

本说明书实施例的目的在于提供一种财务报销数据处理方法、装置及系统,可以大幅度提高财务报销数据处理的效率,降低财务人员的工作量。

本说明书提供一种财务报销数据处理方法、装置及系统是包括如下方式实现的:

一种财务报销数据处理方法,包括:

获取待处理报销申请的报销凭证影像;

根据确定的报销关键区域对所述报销凭证影像进行图像切分处理,获得所述报销关键区域对应的影像切片;

对所述影像切片进行图像文字识别处理,获得所述影像切片对应的子结构化数据;

将所述待处理报销申请的各影像切片对应的子结构化数据进行整合,形成所述待处理报销申请的结构化数据,根据预设校验规则对所述结构化数据进行校验;

调取校验结果中不满足预设要求的子结构化数据对应的影像切片,以对所述结构化数据进行修正处理。

本说明书提供的所述方法的另一个实施例中,所述对所述报销凭证影像进行图像切分处理,包括:

对所述报销凭证影像进行类型识别处理,获得所述报销凭证影像的凭证类型;

根据所述凭证类型确定所述报销凭证影像对应的图像切分算法,利用所述图像切分算法对所述报销凭证影像进行图像切分处理。

本说明书提供的所述方法的另一个实施例中,所述根据预设校验规则对所述结构化数据进行校验,包括:

获取所述待处理报销申请的报销类型,根据所述报销类型确定所述报销凭证影像对应的校验规则;

根据所述对应的校验规则对所述结构化数据进行校验。

本说明书提供的所述方法的另一个实施例中,所述对所述影像切片进行图像文字识别处理,获得所述影像切片对应的子结构化数据,包括:

若影像切片识别失败,则将识别失败的影像切片作为待补录影像切片;

将所述待补录影像切片分配至至少两个补录终端进行补录处理,获得所述待补录影像切片对应的至少两个补录数据;

对所述至少两个补录数据进行一致性校验,当校验结果满足要求时,将所述补录数据作为所述待补录影像切片的子结构化数据。

本说明书提供的所述方法的另一个实施例中,所述方法还包括:

将审核通过的待处理报销申请的影像切片以及影像切片对应的结构化数据更新至报销样本集;

利用更新后的报销样本集对图像切分处理及图像文字识别处理对应的机器学习模型进行更新处理。

另一方面,本说明书还提供一种财务报销数据处理装置,所述装置包括:

数据获取模块,用于获取待处理报销申请的报销凭证影像;

图像切分模块,用于根据确定的报销关键区域对所述报销凭证影像进行图像切分处理,获得所述报销关键区域对应的影像切片;

图像识别模块,用于对所述影像切片进行图像文字识别处理,获得所述影像切片对应的子结构化数据;

数据校验模块,用于将所述待处理报销申请的各影像切片对应的子结构化数据进行整合,形成所述待处理报销申请的结构化数据,根据预设校验规则对所述结构化数据进行校验;

数据调取模块,用于调取校验结果中不满足预设要求的子结构化数据对应的影像切片,以对所述结构化数据进行修正处理。

本说明书提供的所述装置的另一个实施例中,所述图像切分模块包括:

凭证类型确定单元,用于对所述报销凭证影像进行类型识别处理,获得所述报销凭证影像的凭证类型;

图像切分单元,用于根据所述凭证类型确定所述报销凭证影像对应的图像切分算法,利用所述图像切分算法对所述报销凭证影像进行图像切分处理。

本说明书提供的所述装置的另一个实施例中,所述数据校验模块包括:

校验规则确定单元,用于获取所述待处理报销申请的报销类型,根据所述报销类型确定所述报销凭证影像对应的校验规则;

数据校验单元,用于根据所述对应的校验规则对所述结构化数据进行校验。

本说明书提供的所述装置的另一个实施例中,所述图像识别模块包括:

判断单元,用于判断影像切片是否识别失败,若影像切片识别失败,则将识别失败的影像切片作为待补录影像切片;

补录单元,用于将所述待补录影像切片分配至至少两个补录终端进行补录处理,获得所述待补录影像切片对应的至少两个补录数据;

校验单元,用于对所述至少两个补录数据进行一致性校验,当校验结果满足要求时,将所述补录数据作为所述待补录影像切片的子结构化数据。

另一方面,本说明书还提供一种财务报销数据处理设备,包括处理器及用于存储处理器可执行指令的存储器,所述指令被所述处理器执行时实现包括以下步骤:

获取待处理报销申请的报销凭证影像;

根据确定的报销关键区域对所述报销凭证影像进行图像切分处理,获得所述报销关键区域对应的影像切片;

对所述影像切片进行图像文字识别处理,获得所述影像切片对应的子结构化数据;

将所述待处理报销申请的各影像切片对应的子结构化数据进行整合,形成所述待处理报销申请的结构化数据,根据预设校验规则对所述结构化数据进行校验;

调取校验结果中不满足预设要求的子结构化数据对应的影像切片,以对所述结构化数据进行修正处理。

另一方面,本说明书还提供一种财务报销数据处理系统,所述系统包括至少一个处理器以及存储计算机可执行指令的存储器,所述处理器执行所述指令时实现上述任意一个实施例所述方法的步骤。

本说明书一个或多个实施例提供的财务报销数据处理方法、装置及系统,可以通过先对报销凭证进行图像切分处理,获得报销关键区域对应的影像切片,然后,可以再对各影像切片进行文字识别,形成结构化数据。之后,可以再基于预设规则对结构化数据进行自动化核对,对核对结果有问题的数据,可以调取相应的影像切片来快速的实现信息的补录,从而大幅度提高信息校验以及核对补录处理的效率。同时,补录时由于可以利用影像切片来实现,因此还可以采用外包给第三方的形式进行补录,无需担心信息泄露,在保证信息安全性的基础上,进一步提高财务报销数据处理的效率,降低财务人员的工作量。

为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。在附图中:

图1为本说明书提供的一种财务报销数据处理方法实施例的流程示意图;

图2为本说明书提供的一个实施例中的财务报销数据处理方法流程示意图;

图3为本说明书提供的一种财务报销数据处理装置实施例的模块结构示意图;

图4为本说明书提供的另一个实施例中的财务报销数据处理系统的模块结构示意图;

图5为本说明书提供的另一个实施例中的影像处理模块的结构示意图;

图6为本说明书提供的另一个实施例中的财务报销模块的结构示意图;

图7为本说明书提供的另一个实施例中的深度挖掘模块的结构示意图。

为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是说明书一部分实施例,而不是全部的实施例。基于说明书一个或多个实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书实施例方案保护的范围。

在财务报销过程中,需要处理庞大数量的报销凭证,如发票、pos单等各类报销凭证。财务人员需要花费大工作量对各类报销凭证数据进行核对,同时,还需要人工录入大量的报销信息,使得整个报销过程复杂繁琐,工作量巨大。

相应的,本说明书实施例提供了一种财务报销数据处理方法,可以通过先对报销凭证进行图像切分处理,获得报销关键区域对应的影像切片,然后,可以再对各影像切片进行文字识别,形成结构化数据。之后,可以再基于预设规则对结构化数据进行自动化核对,对核对结果有问题的数据,可以调取相应的影像切片来快速的实现信息的补录,从而大幅度提高信息校验以及核对补录处理的效率。同时,补录时由于可以利用影像切片来实现,因此还可以采用外包给第三方的形式进行补录,无需担心信息泄露,在保证信息安全性的基础上,进一步提高财务报销数据处理的效率,降低财务人员的工作量。

图1是本说明书提供的所述一种财务报销数据处理方法实施例流程示意图。虽然本说明书提供了如下述实施例或附图所示的方法操作步骤或装置结构,但基于常规或者无需创造性的劳动在所述方法或装置中可以包括更多或者部分合并后更少的操作步骤或模块单元。在逻辑性上不存在必要因果关系的步骤或结构中,这些步骤的执行顺序或装置的模块结构不限于本说明书实施例或附图所示的执行顺序或模块结构。所述的方法或模块结构的在实际中的装置、服务器或终端产品应用时,可以按照实施例或者附图所示的方法或模块结构进行顺序执行或者并行执行(例如并行处理器或者多线程处理的环境、甚至包括分布式处理、服务器集的实施环境)。

具体的一个实施例如图1所示,本说明书提供的财务报销数据处理方法的一个实施例中,所述方法可以包括:

S0:获取待处理报销申请的报销凭证影像。

可以获取待处理报销申请的报销凭证影像。所述报销凭证影像可以包括对报销凭证扫描或者拍摄等方式获得的影像数据,报销凭证如可以包括各种类型的发票、POS单等。用户可以在填写报销申请时调取相应的设备进行报销凭证的扫描或者拍摄,也可以将预先已扫描或者拍摄好的报销凭证影像进行上传,形成待处理报销申请的报销凭证影像文件,存储于文件服务器中。

S2:根据确定的报销关键区域对所述报销凭证影像进行图像切分处理,获得所述报销关键区域对应的影像切片;

所述报销关键区域可以为报销申请中所关注内容对应的区域,如开票日期、金额、账号等对应的区域。如可以通过分析待处理报销申请的所关注的内容确定报销关键区域,也可以通过综合分析某一类报销申请所关注的内容,预先确定某一类报销申请所关注的报销关键区域。

获取报销申请对应的报销凭证影像后,可以先对报销凭证影像进行特征分析,对各报销关键区域进行初步定位,然后,可以根据预设图像切分算法对报销凭证影像进行报销关键区域准确提取,获得报销凭证影像中各报销关键区域对应的影像切片。

本说明书的一个实施例中,可以先对所述报销凭证影像进行类型识别处理,获得所述报销凭证影像的凭证类型,然后,根据所述凭证类型确定所述报销凭证影像对应的图像切分算法,利用所述图像切分算法对所述报销凭证影像进行图像切分处理。

可以预先对报销凭证进行分类,将具有相似特征的报销凭证划分为一类,然后,可以针对每一类报销凭证构建相应的图像切分算法。实际应用场景中,可以先对报销凭证影像进行类型识别,确定报销凭证影像所属的凭证类型。然后,可以根据凭证类型对应的图像切分算法对报销凭证影像进行关键区域准确坐标定位,根据位置坐标进行图像切分处理,提取出各报销关键区域对应的影像,获得各报销关键区域对应的影像切片。

报销凭证的类型有很多种,不同类型的报销凭证的报销关键区域可能存在一定的差异性。如发票和POS单的金额、收款人信息在凭证中的具体位置可能存在较大的差异性,直接通过关键信息特征分析的方式进行报销关键区域位置坐标的准确定位,可能存在识别不准确的问题。通过先对报销凭证进行分类,分别进行图像切分算法的构建,然后,利用各类型对应的图像切分算法进行图像切分处理,可以进一步提高报销凭证影像关键区域提取的准确性,进而提高报销凭证中关键信息提取的准确性。

实际应用中,用户可能会将多个报销凭证的影像扫描至一个影像文件中进行存储,本说明书的一些实施方式中,在图像切分处理之前,还可以先对报销凭证影像进行预处理,提取出各报销凭证对应的影像,作为所述报销凭证影像。再确定各报销凭证影像的凭证类型,根据凭证类型对报销凭证影像进行图像切分处理,可以进一步提高关键区域提取以及切分处理的效率与准确性。

S4:对所述影像切片进行图像文字识别处理,获得所述影像切片对应的子结构化数据。

可以对影像切片进行图像文字识别,获得影像切片对应的子结构化数据。结构化数据可以包括由二维表结构来逻辑表达和实现的数据,可以通过关系型数据库进行存储和管理。对影像进行文字识别处理,可以提取出影像中的文字或者数字信息,然后,可以将识别出的文字或者数字信息根据其在影像中的分布特征以及语法特征,存储为结构化数据,以便于数据的后续分析及处理。

对影像切片进行图像文字识别处理,若识别成功,可以将识别成功的文字、数字存储为结构化数据的形式,为了便于区分表述,本说明书实施例中,可以将影像切片对应的结构化数据定义为子结构化数据。

本说明书的另一个实施例中,若影像切片识别失败,则可以将识别失败的影像切片作为待补录影像切片;将所述待补录影像切片分配至至少两个补录终端进行补录处理,获得所述待补录影像切片对应的至少两个补录数据;对所述至少两个补录数据进行一致性校验,当校验结果满足要求时,将所述补录数据作为所述待补录影像切片的子结构化数据。

对影像切片进行图像文字识别时,如可以识别出影像切片中的内容,则获得识别数据的同时,还可以获得识别数据的识别置信度;如影像切片中的内容没能识别,则可以获得如内容识别失败的结果提示。一些实施方式中,可以将识别置信度低于预设阈值或者内容没能识别的影像切片作为识别失败的影像切片,以进行补录处理。

然后,可以将待补录影像切片分配至补录终端,以进行补录处理。补录过程中,由于补录终端仅对外展示影像切片,并不展示完整的报销凭证影像,因此,补录操作还可以采用外包的方式,无需担心信息泄露。如,可以由第三方工作人员利用补录终端对影像切片进行补录处理,补录终端可以获取第三方工作人员输入的补录数据,从而可以在保证信息安全性的基础上,大幅度降低财务人员的工作量。

一些实施方式中,还可以将待补录影像切片分配至至少两个补录终端,以进行补录处理,可以获得至少两个补录数据,然后,可以再对所述至少两个补录数据进行一致性校验。由于补录通常采用人工完成,补录过程单调且数据量较大,容易存在补录数据录入错误的问题,通过两录一较的方式进行补录处理,可以进一步提高数据补录的准确度。

S6:将所述待处理报销申请的各影像切片对应的子结构化数据进行整合,形成所述待处理报销申请的结构化数据,根据预设校验规则对所述结构化数据进行校验。

利用上述实施例对待处理报销申请的报销凭证影像进行图像识别处理,并对识别有问题的影像切片进行补录处理后,可以获得待处理报销申请中各影像切片的子结构化数据。然后,可以将待处理报销申请的各影像切片对应的子结构化数据进行梳理,组织形成待处理报销申请的结构化数据。

可以利用预设校验规则对待处理报销申请的结构化数据进行自动化校验,以验证最终获得的结构化数据的准确性。例如,可以校验结构化数据中的各收款人信息、金额明细、金额总额等各类报销信息是否与报销单中填写的信息一致。所述预设校验规则可以通过分析历史报销申请的结构化数据与报销单中填写的数据确定。

本说明书的一个实施例中,可以先获取所述待处理报销申请的报销类型,根据所述报销类型确定所述报销凭证影像对应的校验规则,然后,可以根据所述对应的校验规则对所述结构化数据进行校验。

报销申请可以包括多种报销类型,如可以包括出差报销、采购合同报销、产品检测报销等多种分类方式。可以预先对报销申请进行分类,获得报销申请的多种报销类型,分类的方式可以参照现有报销系统中的报销流程进行,也可以自行设定,这里不做限定。然后,可以分析各报销类型对应的结构化数据分布特征,通过如人工智能学习的方式确定各报销类型对应的校验规则。实际应用场景中,对于待处理报销申请,可以先获取或者识别分析确定其对应的报销类型,然后,根据该报销类型对应的校验规则对结构化数据进行校验,获得校验结果。

每一种报销类型对应的结构化数据特征存在较大的差异性,通过先根据各报销类型的结构数据特征确定对应的校验规则,然后,再利用相应的校验规则进行结构化数据准确性校验,可以进一步提高校验处理的效率以及准确性。

S8:调取校验结果中不满足预设要求的子结构化数据对应的影像切片,以对所述结构化数据进行修正处理。

当校验结果全部满足预设要求,如各收款人信息、金额明细、金额总额等各类报销信息均与报销单中填写的信息一致时,可以提示校验通过,然后,可以进入下一步支付报销环节。所述预设要求根据实际需要自行设定,这里不做限定。一些实施方式中,所述预设要求如可以为子结构化数据中的报销信息与报销单中填写的信息是否一致等,如存在与申请单上的信息不一致或者缺失的数据时,则可以认为不符合预设要求。

如果存在校验结果不满足预设要求的数据,如存在与申请单上的信息不一致或者缺失的数据时,可以展示出该不满足要求的子结构化数据,供财务人员进行审阅。一些实施方式中,可以根据财务人员的操作调取不满足要求的子结构化数据对应的影像切片,以进行信息核对以及补录处理。例如,如果为某收款人信息存在问题,则可以调取该收款人信息对应的影像切片,以进行信息核对以及补录处理;如果是报销金额总额出现问题,则可以调取与金额有关的影像切片,以进行金额信息核对以及补录处理。

上述处理过程中,可以由财务人员利用影像切片对有问题的子结构化数据进行初步核对,然后,再由财务人员对利用补录终端对信息有误的数据进行补录处理。为了进一步提高效率,也可以将待补录的影像切片采用外包的形式,交由第三方进行补录处理。如果存在信息缺失且又无法调取相应影像切片的情况,也可以仅由财务人员根据报销凭证影像进行全量信息核对以及补录处理,以保证信息的安全性。

结构化数据校验环节完成后,财务人员可以进一步对报销申请进行审核,并可通过查看切片与结构化数据,检查图像识别结果是否正确,也可以查看全部凭证影像进行人工审核。若财务人员发现图像识别结果有误,可以通过根据影像切片对结构化数据进行修正,也可以根据凭证影像录入结构化数据,确保数据的正确性。财务审核通过后,报销单转入支付流程进行自动报销支付,如未通过,则退回申请人修改处理,或者,结束报销流程。

然后,可以将审核通过的报销数据及其凭证影像归档,形成档案库,用于数据分析及挖掘,如分析处理时效、报销金额统计、报销分类统计等等。同时,还可以将审核通过的影像及其结构化数据用于机器学习模块进行深度学习,进一步提升影像识别的正确率。基于上述实施场景,本说明书的另一个实施例中,所述方法还可以包括:

将审核通过的待处理报销申请的影像切片以及影像切片对应的结构化数据更新至报销样本集;

利用更新后的报销样本集对图像切分处理及图像文字识别处理对应的机器学习模型进行更新处理。

图2表示本说明书提供的一种财务报销数据处理方法的流程示意图。如图2所示,本说明书的一个应用场景中,所述财务报销数据处理方法可以包括如下步骤:

S01:获取报销人员准备的报销凭证;

S02:利用凭证扫描模块对报销凭证扫描并存储,获得报销凭证影像;

S03:对凭证影像类型识别、图像切分处理以及文字识别处理:

301:使用图像识别机器学习模型对凭证影像进行分类,将分类后的影像中关注内容的图片区域进行切片,保存为影像切片文件;

302:对影像切片进行图像文字识别,获得影像切片对应的子结构化数据;

S04:判断是否存在识别失败的影像切片;

S05:如果存在识别失败的影像切片,则对影像切片进行补录;

针对识别内容失败,或是识别置信度低于阈值的影像切片,可以有两个补录终端完成切片上内容的录入,只有补录一致的才认为补录完成(两录一校)。由于只有切片的影像,提高了录入的速度,并可外包给第三方进行补录而无需担心信息泄露。

S06:使用预设校验规则对结构化数据进行校验;

可以针对不同的报销类型,设计不同的校验规则对结构化数据进行校验。

S07:财务人员审核;

财务人员审核自动校验结果,并可通过查看切片与结构化数据,检查图像识别结果是否正确,也可以查看全部凭证影像进行人工审核。

S08:判断是否存在影像识别错误的数据;

S09:如果存在,可以根据影像切片或者影像补充填写凭证数据;

S10:判断财务是否审核通过,如果否,可退回重新扫描,或是直接不同意终止流程;

S11:如果是,则将审核通过的数据进行后续处理:

S12:根据审核通过的数据进行报销支付;

S13:将审核通过的数据更新至样本集,以进行图像识别机器学习;

S14:将审核通过的数据进行报销档案归档,以用于后续数据分析,如处理时效,报销金额统计,报销分类统计等等。

本说明书上述一个或者多个实施例,通过将报销凭证扫描影像化,内容识别,自动审核规则校验等方法,可以有效提高财务报销审核的效率。对于有问题的数据进行补录时,因补录过程中只能看到凭证的局部,无法看到整个图像,使得补录操作还可外包给第三方进行,而无需担心信息泄露,大幅度降低财务人员的工作量。同时,还可以将审批通过的数据作为已标注的图像识别数据,对图像识别机器学习模型进行更新处理,进一步提高图像识别的准确度。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。具体的可以参照前述相关处理相关实施例的描述,在此不做一一赘述。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

本说明书一个或多个实施例提供的财务报销数据处理方法,可以通过先对报销凭证进行图像切分处理,获得报销关键区域对应的影像切片,然后,可以再对各影像切片进行文字识别,形成结构化数据。之后,可以再基于预设规则对结构化数据进行自动化核对,对核对结果有问题的数据,可以调取相应的影像切片来快速的实现信息的补录,从而大幅度提高信息校验以及核对补录处理的效率。同时,补录时由于可以利用影像切片来实现,因此还可以采用外包给第三方的形式进行补录,无需担心信息泄露,在保证信息安全性的基础上,进一步提高财务报销数据处理的效率,降低财务人员的工作量。

基于上述所述的财务报销数据处理方法,本说明书一个或多个实施例还提供一种财务报销数据处理装置。所述的装置可以包括使用了本说明书实施例所述方法的系统、软件(应用)、模块、组件、服务器等并结合必要的实施硬件的装置。基于同一创新构思,本说明书实施例提供的一个或多个实施例中的装置如下面的实施例所述。由于装置解决问题的实现方案与方法相似,因此本说明书实施例具体的装置的实施可以参见前述方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。具体的,图3表示说明书提供的一种财务报销数据处理装置实施例的模块结构示意图,如图3所示,所述装置可以包括:

数据获取模块102,可以用于获取待处理报销申请的报销凭证影像;

图像切分模块104,可以用于根据确定的报销关键区域对所述报销凭证影像进行图像切分处理,获得所述报销关键区域对应的影像切片;

图像识别模块106,可以用于对所述影像切片进行图像文字识别处理,获得所述影像切片对应的子结构化数据;

数据校验模块108,可以用于将所述待处理报销申请的各影像切片对应的子结构化数据进行整合,形成所述待处理报销申请的结构化数据,根据预设校验规则对所述结构化数据进行校验;

数据调取模块110,可以用于调取校验结果中不满足预设要求的子结构化数据对应的影像切片,以对所述结构化数据进行修正处理。

本说明书的另一个实施例中,所述图像切分模块104可以包括:

凭证类型确定单元,可以用于对所述报销凭证影像进行类型识别处理,获得所述报销凭证影像的凭证类型;

图像切分单元,可以用于根据所述凭证类型确定所述报销凭证影像对应的图像切分算法,利用所述图像切分算法对所述报销凭证影像进行图像切分处理。

本说明书的另一个实施例中,所述数据校验模块108可以包括:

校验规则确定单元,可以用于获取所述待处理报销申请的报销类型,根据所述报销类型确定所述报销凭证影像对应的校验规则;

数据校验单元,可以用于根据所述对应的校验规则对所述结构化数据进行校验。

本说明书的另一个实施例中,所述图像识别模块106可以包括:

判断单元,可以用于判断影像切片是否识别失败,若影像切片识别失败,则将识别失败的影像切片作为待补录影像切片;

补录单元,可以用于将所述待补录影像切片分配至至少两个补录终端进行补录处理,获得所述待补录影像切片对应的至少两个补录数据;

校验单元,可以用于对所述至少两个补录数据进行一致性校验,当校验结果满足要求时,将所述补录数据作为所述待补录影像切片的子结构化数据。

需要说明的,上述所述的装置根据方法实施例的描述还可以包括其他的实施方式。具体的实现方式可以参照相关方法实施例的描述,在此不作一一赘述。

本说明书一个或多个实施例提供的财务报销数据处理装置,可以通过先对报销凭证进行图像切分处理,获得报销关键区域对应的影像切片,然后,可以再对各影像切片进行文字识别,形成结构化数据。之后,可以再基于预设规则对结构化数据进行自动化核对,对核对结果有问题的数据,可以调取相应的影像切片来快速的实现信息的补录,从而大幅度提高信息校验以及核对补录处理的效率。同时,补录时由于可以利用影像切片来实现,因此还可以采用外包给第三方的形式进行补录,无需担心信息泄露,在保证信息安全性的基础上,进一步提高财务报销数据处理的效率,降低财务人员的工作量。

本说明书提供的上述实施例所述的方法或装置可以通过计算机程序实现业务逻辑并记录在存储介质上,所述的存储介质可以计算机读取并执行,实现本说明书实施例所描述方案的效果。因此,本说明书还提供一种财务报销数据处理设备,包括处理器及存储处理器可执行指令的存储器,所述指令被所述处理器执行时实现包括以下步骤:

获取待处理报销申请的报销凭证影像;

根据确定的报销关键区域对所述报销凭证影像进行图像切分处理,获得所述报销关键区域对应的影像切片;

对所述影像切片进行图像文字识别处理,获得所述影像切片对应的子结构化数据;

将所述待处理报销申请的各影像切片对应的子结构化数据进行整合,形成所述待处理报销申请的结构化数据,根据预设校验规则对所述结构化数据进行校验;

调取校验结果中不满足预设要求的子结构化数据对应的影像切片,以对所述结构化数据进行修正处理。

所述存储介质可以包括用于存储信息的物理装置,通常是将信息数字化后再以利用电、磁或者光学等方式的媒体加以存储。所述存储介质有可以包括:利用电能方式存储信息的装置如,各式存储器,如RAM、ROM等;利用磁能方式存储信息的装置如,硬盘、软盘、磁带、磁芯存储器、磁泡存储器、U盘;利用光学方式存储信息的装置如,CD或DVD。当然,还有其他方式的可读存储介质,例如量子存储器、石墨烯存储器等等。

需要说明的,上述所述的设备根据方法实施例的描述还可以包括其他的实施方式。具体的实现方式可以参照相关方法实施例的描述,在此不作一一赘述。

上述实施例所述的财务报销数据处理设备,可以通过先对报销凭证进行图像切分处理,获得报销关键区域对应的影像切片,然后,可以再对各影像切片进行文字识别,形成结构化数据。之后,可以再基于预设规则对结构化数据进行自动化核对,对核对结果有问题的数据,可以调取相应的影像切片来快速的实现信息的补录,从而大幅度提高信息校验以及核对补录处理的效率。同时,补录时由于可以利用影像切片来实现,因此还可以采用外包给第三方的形式进行补录,无需担心信息泄露,在保证信息安全性的基础上,进一步提高财务报销数据处理的效率,降低财务人员的工作量。

本说明书还提供一种财务报销数据处理系统,所述系统可以为单独的财务报销数据处理系统,也可以应用在多种计算机数据处理系统中。所述的系统可以为单独的服务器,也可以包括使用了本说明书的一个或多个所述方法或一个或多个实施例装置的服务器集、系统(包括分布式系统)、软件(应用)、实际操作装置、逻辑门电路装置、量子计算机等并结合必要的实施硬件的终端装置。所述财务报销数据处理系统可以包括至少一个处理器以及存储计算机可执行指令的存储器,所述处理器执行所述指令时实现上述任意一个或者多个实施例中所述方法的步骤。

图4表示本说明书提供的一种财务报销数据处理系统结构示意图。如图4所示,该系统可以包括凭证扫描模块、影像处理模块、财务报销模块和深度挖掘模块。凭证扫描模块对报销凭证进行扫描后,可以将凭证影像发送给影像处理模块。图5表示影像处理模块的模块结构示意图,如图5所示,所述影像处理模块可以包括影像识别模块、影像切分模块和补录模块。影像识别模块、影像切分模块可以对凭证影像进行图像切分及图像识别处理,对于识别失败的影像可以利用补录模块进行补录处理。

影像处理模块可以将凭证影像和结构化数据发送给财务报销模块。图6表示财务报销模块的模块结构示意图,如图6所示,所述财务报销模块可以包括审核规则引擎、财务审核引擎、支付模块以及财务补录模块。审核规则引擎可以对凭证影像及结构化数据进行校验,财务审核模块可以对校验结果进行审核,如果存在错误数据,则财务补录模块还可以对错误数据进行补录处理。当结构化数据没有错误时,则可以转入支付模块进行报销处理。

同时,影像处理模块及财务报销模块还可以将凭证影像、结构化数据及将财务报销数据发送给深度挖掘模块。图7表示深度挖掘模块的模块结构示意图,如图7所示,所述深度挖掘模块可以包括报销档案库、深度挖掘模块以及机器学习模块。审批通过的数据可以作为已标注的图像识别数据,进行自动机器学习,进一步提高图像识别准确度,同时还可以完善报销档案库,供数据分析挖掘。

需要说明的,上述所述的系统根据方法或者装置实施例的描述还可以包括其他的实施方式,具体的实现方式可以参照相关方法实施例的描述,在此不作一一赘述。

上述实施例所述的财务报销数据处理系统,可以通过先对报销凭证进行图像切分处理,获得报销关键区域对应的影像切片,然后,可以再对各影像切片进行文字识别,形成结构化数据。之后,可以再基于预设规则对结构化数据进行自动化核对,对核对结果有问题的数据,可以调取相应的影像切片来快速的实现信息的补录,从而大幅度提高信息校验以及核对补录处理的效率。同时,补录时由于可以利用影像切片来实现,因此还可以采用外包给第三方的形式进行补录,无需担心信息泄露,在保证信息安全性的基础上,进一步提高财务报销数据处理的效率,降低财务人员的工作量。

需要说明的是,本说明书上述所述的装置或者系统根据相关方法实施例的描述还可以包括其他的实施方式,具体的实现方式可以参照方法实施例的描述,在此不作一一赘述。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于硬件+程序类、存储介质+程序实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本说明书实施例并不局限于必须是符合标准数据模型/模板或本说明书实施例所描述的情况。某些行业标准或者使用自定义方式或实施例描述的实施基础上略加修改后的实施方案也可以实现上述实施例相同、等同或相近、或变形后可预料的实施效果。应用这些修改或变形后的数据获取、存储、判断、处理方式等获取的实施例,仍然可以属于本说明书的可选实施方案范围之内。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、车载人机交互设备、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书一个或多个时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法或者设备中还存在另外的相同要素。

本领域技术人员应明白,本说明书一个或多个实施例可提供为方法、系统或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本本说明书一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述并不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

本文发布于:2023-04-14 05:12:08,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/3/86436.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图