一种健康保险赔欺诈及滥用的侦测方法和系统

阅读: 评论:0

著录项
  • CN201711277990.3
  • 20171206
  • CN107871285A
  • 20180403
  • 和金在线(北京)科技有限公司
  • 谢建军;孙英涛;原雷
  • G06Q40/08
  • G06Q40/08 G06Q30/00

  • 北京市朝阳区望京soho塔一A座1217室
  • 北京(11)
  • 北京路浩知识产权代理有限公司
  • 王莹;李相雨
摘要
本发明实施例公开一种健康保险赔欺诈及滥用的侦测方法和系统,其中,方法包括:接收用户设备提交的理赔申请;根据所述理赔申请,获取理赔所需数据;根据所述理赔所需数据,判断是否调用预先建立的模型评分引擎和规则评分引擎;若是,则基于所述理赔所需数据,调用所述模型评分引擎产生模型评分和风险提示因子,以及调用所述规则评分引擎产生规则触发结果和规则风险评分;根据产生的模型评分、风险提示因子、规则触发结果和规则风险评分,生成风险评估报告;根据所述风险评估报告,获得最终是否理赔的结论,并将获得的理赔结论的理赔数据存入历史理赔数据库。本发明实施例能实现对健康保险赔欺诈及滥用进行侦测,大大提高了侦测的准确性和效率。
权利要求

1.一种健康保险赔欺诈及滥用的侦测方法,其特征在于,包括:

接收用户设备提交的理赔申请;

根据所述理赔申请,获取理赔所需数据;

根据所述理赔所需数据,判断是否调用预先建立的模型评分引擎和规则评分引擎;

若是,则基于所述理赔所需数据,调用所述模型评分引擎产生模型评分和风险提示因 子,以及调用所述规则评分引擎产生规则触发结果和规则风险评分;

根据产生的模型评分、风险提示因子、规则触发结果和规则风险评分,生成风险评估报 告;

根据所述风险评估报告,获得最终是否理赔的结论,并将获得的理赔结论的理赔数据 存入历史理赔数据库。

2.根据权利要求1所述的方法,其特征在于,所述理赔申请的数据,包括:被保人姓名、 证件号码、出生日期、保单号、医生诊断书,处方、住院、诊治或药品的收据、医院名称及地 址、诊治日期和住院日期。

3.根据权利要求1所述的方法,其特征在于,所述理赔所需数据,包括:当前申请数据, 历史理赔数据和保单数据;

相应地,所述根据所述理赔申请,获取理赔所需数据,包括:

用所述理赔申请的数据中的证件号码在预先存储的历史理赔数据库中进行匹配,调取 当前被保人的历史理赔数据;

用所述理赔申请的数据中的证件号码在预先存储的保单数据库中进行匹配,调取当前 被保人的保单数据。

4.根据权利要求3所述的方法,其特征在于,所述当前申请数据是指从原始申请数据中 到处理赔审核所需数据,包括:年龄、看病次数和每次看病的各项费用;

所述历史理赔数据,包括:历次理赔的时间、住院/诊治费用、诊治项目、疾病代码和住 院天数;

所述保单数据,包括:保单信息、保险金额、保险余额、保险责任和起止日期。

5.根据权利要求3所述的方法,其特征在于,所述模型评分引擎是基于历史理赔数据, 采用无监督机器学习的方法预先建立的用于进行健康保险欺诈或滥用探测的模型;

相应地,所述基于所述理赔所需数据,调用所述模型评分引擎产生模型评分和风险提 示因子,包括:

基于预设时间段内的历史理赔数据,产生分位数表,并存入更新预先建立的分位数表 数据库;

从当前申请数据、历史理赔数据和本次产生的分位数表中提取特征变量,所述特征变 量从不同维度刻画了健康保险赔案的特征,所述特征变量根据数据来源分为住院/诊治类、 收费收据类、历史理赔类、当前理赔类及其它类别;

采用无监督机器学习的方法,对所提取的特征变量进行学习,获得原始评分;

通过评分校准,将所述原始评分的分布转化为预设分布范围内,获得最终的模型评分 和风险提示因子。

6.根据权利要求5所述的方法,其特征在于,所述不同维度,包括:索赔行为、医疗行为、 诊疗项目、疾病诊断和/或药品项目。

7.根据权利要求5所述的方法,其特征在于,所述基于预设时间段内的历史理赔数据, 产生分位数表,并存入更新预先建立的分位数表数据库,包括:

每隔预设时间段,从历史理赔数据中抽取所述预设时间段内的数据;

基于所抽取的数据,对各类费用项的费用、住院天数、药品数,按疾病、年龄、险种进行 统计,产生分位数表;

将本次产生的分位数表与预先建立的分位数表数据库中已有的分位数表进行比对,利 用本次产生的分位数表,对预先建立的分位数表数据库中已有的分位数表中有变化的数据 项进行更新存储。

8.根据权利要求3所述的方法,其特征在于,所述规则评分引擎是由一系列基于历史理 赔数据、当前申请数据和预先存储的药品/诊疗知识库数据而预先设置的专家规则组成;

相应地,所述调用所述规则评分引擎产生规则触发结果和规则风险评分,包括:

调用所述规则评分引擎,根据所述规则评分引擎中预先设置的专家规则,检查理赔申 请是否符合保险产品的要求,并对理赔申请的数据的完整性、准确性、一致性和逻辑性进行 规则判断,同时也对审核中发现的常见违规行为进行审核。

9.根据权利要求1所述的方法,其特征在于,根据所述理赔所需数据,判断是否调用预 先建立的模型评分引擎和规则评分引擎,包括:

若所述理赔所需数据中缺失关键的理赔数据,申请资料不全,则直接做出不予受理的 结论,并确定不调用预先建立的模型评分引擎和规则评分引擎。

10.一种健康保险赔欺诈及滥用的侦测系统,其特征在于,包括:

接收模块,用于接收用户设备提交的理赔申请;

数据获取模块,用于根据所述理赔申请,获取理赔所需数据;

判断模块,用于根据所述理赔所需数据,判断是否调用预先建立的模型评分引擎和规 则评分引擎;

调用模块,用于判断得知要调用预先建立的模型评分引擎和规则评分引擎,则基于所 述理赔所需数据,调用所述模型评分引擎产生模型评分和风险提示因子,以及调用所述规 则评分引擎产生规则触发结果和规则风险评分;

生成模块,用于根据产生的模型评分、风险提示因子、规则触发结果和规则风险评分, 生成风险评估报告;

结论获取模块,用于根据所述风险评估报告,获得最终是否理赔的结论,并将获得的理 赔结论的理赔数据存入历史理赔数据库。

说明书
技术领域

本发明实施例涉及数据处理技术领域,具体涉及一种健康保险赔欺诈及滥用的侦 测方法和系统。

随着商业健康保险在我国被越来越多的人接受,保险成为个人及家庭提供医疗保 障的重要渠道。但保险欺诈行为不仅损害了保险机构的利益,也损害了广大投保人的利益。 数据显示,国际上的保险金额约占赔付总额的10%,某些险种的欺诈金额占比甚至高 达50%。美国卫生健康反欺诈协会估计健康欺诈每年至少680亿美元,其他机构估计欺诈金 额高达每年2300亿美元。

健康医疗保险欺诈行为是指个人或机构利用欺骗手段,在医疗过程及保险理赔中 获取利益。这既包括后续引发刑事诉讼行为的“硬性欺诈”(Fraud),也包括过度医疗或高估 医疗费用的“软性欺诈”(Abuse and Waste)。常见的医疗保险欺诈行为包括:1、伪造或篡改 医疗病例或费用单据;2、升级医疗代码(upcoding);3、隐瞒既存病史或既往病例;4、冒名顶 替;5、拆分同一医疗事件为多个独立事件(unbundling);6、挂床;7、把保险不涵盖的医疗手 段或诊治改为涵盖的手段等等。

随着我国保险业的快速发展,保险公司业务范围不断扩大,各类保险欺诈活动也 日益频繁。资料显示,在上世纪80年代末期,犯罪中涉及保险欺诈的仅占2%左右;到 2000年底,这类案件上升到9%左右;到2012年,则升至12%左右。保险欺诈不仅损害了保险 消费者权益,造成保险服务资源浪费,还增加了保险公司运营管控成本,破坏了正常的市场 秩序。所以保险欺诈被喻为保险业无声的巨灾,吞噬着保险业的盈利空间,也扰乱保险市场 秩序,成为隐藏在保险市场的一颗毒瘤。保险行业的反欺诈工作意义重大。但是由于保险欺 诈的形式多样,人工核实困难,发现识别滞后等痛点,为大规模反欺诈系统建立提出了挑 战。

鉴于此,如何提供一种健康保险赔欺诈及滥用的侦测方法和系统,以实现对健康 保险赔欺诈及滥用进行侦测成为目前需要解决的技术问题。

由于现有方法存在上述问题,本发明实施例提出一种健康保险赔欺诈及滥用的侦 测方法和系统。

第一方面,本发明实施例提出一种健康保险赔欺诈及滥用的侦测方法,包括:

接收用户设备提交的理赔申请;

根据所述理赔申请,获取理赔所需数据;

根据所述理赔所需数据,判断是否调用预先建立的模型评分引擎和规则评分引 擎;

若是,则基于所述理赔所需数据,调用所述模型评分引擎产生模型评分和风险提 示因子,以及调用所述规则评分引擎产生规则触发结果和规则风险评分;

根据产生的模型评分、风险提示因子、规则触发结果和规则风险评分,生成风险评 估报告;

根据所述风险评估报告,获得最终是否理赔的结论,并将获得的理赔结论的理赔 数据存入历史理赔数据库。

可选地,所述理赔申请的数据,包括:被保人姓名、证件号码、出生日期、保单号、医 生诊断书,处方、住院、诊治或药品的收据、医院名称及地址、诊治日期和住院日期。

可选地,所述理赔所需数据,包括:当前申请数据,历史理赔数据和保单数据;

相应地,所述根据所述理赔申请,获取理赔所需数据,包括:

用所述理赔申请的数据中的证件号码在预先存储的历史理赔数据库中进行匹配, 调取当前被保人的历史理赔数据;

用所述理赔申请的数据中的证件号码在预先存储的保单数据库中进行匹配,调取 当前被保人的保单数据。

可选地,所述当前申请数据是指从原始申请数据中到处理赔审核所需数据,包括: 年龄、看病次数和每次看病的各项费用;

所述历史理赔数据,包括:历次理赔的时间、住院/诊治费用、诊治项目、疾病代码 和住院天数;

所述保单数据,包括:保单信息、保险金额、保险余额、保险责任和起止日期。

可选地,所述模型评分引擎是基于历史理赔数据,采用无监督机器学习的方法预 先建立的用于进行健康保险欺诈或滥用探测的模型;

相应地,所述基于所述理赔所需数据,调用所述模型评分引擎产生模型评分和风 险提示因子,包括:

基于预设时间段内的历史理赔数据,产生分位数表,并存入更新预先建立的分位 数表数据库;

从当前申请数据、历史理赔数据和本次产生的分位数表中提取特征变量,所述特 征变量从不同维度刻画了健康保险赔案的特征,所述特征变量根据数据来源分为住院/诊 治类、收费收据类、历史理赔类、当前理赔类及其它类别;

采用无监督机器学习的方法,对所提取的特征变量进行学习,获得原始评分;

通过评分校准,将所述原始评分的分布转化为预设分布范围内,获得最终的模型 评分和风险提示因子。

可选地,所述不同维度,包括:索赔行为、医疗行为、诊疗项目、疾病诊断和/或药品 项目。

可选地,所述基于预设时间段内的历史理赔数据,产生分位数表,并存入更新预先 建立的分位数表数据库,包括:

每隔预设时间段,从历史理赔数据中抽取所述预设时间段内的数据;

基于所抽取的数据,对各类费用项的费用、住院天数、药品数,按疾病、年龄、险种 进行统计,产生分位数表;

将本次产生的分位数表与预先建立的分位数表数据库中已有的分位数表进行比 对,利用本次产生的分位数表,对预先建立的分位数表数据库中已有的分位数表中有变化 的数据项进行更新存储。

可选地,所述规则评分引擎是由一系列基于历史理赔数据、当前申请数据和预先 存储的药品/诊疗知识库数据而预先设置的专家规则组成;

相应地,所述调用所述规则评分引擎产生规则触发结果和规则风险评分,包括:

调用所述规则评分引擎,根据所述规则评分引擎中预先设置的专家规则,检查理 赔申请是否符合保险产品的要求,并对理赔申请的数据的完整性、准确性、一致性和逻辑性 进行规则判断,同时也对审核中发现的常见违规行为进行审核。

可选地,根据所述理赔所需数据,判断是否调用预先建立的模型评分引擎和规则 评分引擎,包括:

若所述理赔所需数据中缺失关键的理赔数据,申请资料不全,则直接做出不予受 理的结论,并确定不调用预先建立的模型评分引擎和规则评分引擎。

第二方面,本发明实施例还提出一种健康保险赔欺诈及滥用的侦测系统,包括:

接收模块,用于接收用户设备提交的理赔申请;

数据获取模块,用于根据所述理赔申请,获取理赔所需数据;

判断模块,用于根据所述理赔所需数据,判断是否调用预先建立的模型评分引擎 和规则评分引擎;

调用模块,用于若判断得知要调用预先建立的模型评分引擎和规则评分引擎,则 基于所述理赔所需数据,调用所述模型评分引擎产生模型评分和风险提示因子,以及调用 所述规则评分引擎产生规则触发结果和规则风险评分;

生成模块,用于根据产生的模型评分、风险提示因子、规则触发结果和规则风险评 分,生成风险评估报告;

结论获取模块,用于根据所述风险评估报告,获得最终是否理赔的结论,并将获得 的理赔结论的理赔数据存入历史理赔数据库。

由上述技术方案可知,本发明实施例通过接收用户设备提交的理赔申请,根据所 述理赔申请,获取理赔所需数据,根据所述理赔所需数据,判断是否调用预先建立的模型评 分引擎和规则评分引擎;若是,则基于所述理赔所需数据,调用所述模型评分引擎产生模型 评分和风险提示因子,以及调用所述规则评分引擎产生规则触发结果和规则风险评分,根 据产生的模型评分、风险提示因子、规则触发结果和规则风险评分,生成风险评估报告,根 据所述风险评估报告,获得最终是否理赔的结论,并将获得的理赔结论的理赔数据存入历 史理赔数据库,由此,能够实现对健康保险赔欺诈及滥用进行侦测,大大提高了侦测的准确 性和效率。

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些图获得其他的附图。

图1为本发明一实施例提供的一种健康保险赔欺诈及滥用的侦测方法的流程示意 图;

图2为本发明实施例提供的一种调用模型评分引擎的流程示意图;

图3为本发明实施例提供的一种调用规则评分引擎的流程示意图;

图4为本发明一实施例提供的一种健康保险赔欺诈及滥用的侦测系统的结构示意 图;

图5为本发明一实施例提供的电子设备的逻辑框图。

下面结合附图,对本发明的具体实施方式作进一步描述。以下实施例仅用于更加 清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。

图1示出了本发明一实施例提供的一种健康保险赔欺诈及滥用的侦测方法的流程 示意图,如图1所示,本实施例的一种健康保险赔欺诈及滥用的侦测方法,包括:

S1、接收用户设备提交的理赔申请。

需要说明的是,本实施例在接收用户设备提交的理赔申请后,可以对所述理赔申 请产生理赔申请唯一索引代码,对每次就医产生事件索引代码,对每个收据产生收据代码。

在具体应用中,所述理赔申请的数据可以包括:被保人姓名、证件号码、出生日期、 保单号、医生诊断书,处方、住院、诊治或药品的收据、医院名称及地址、诊治日期和住院日 期等,本实施例并不对其进行限制,也可以包括其他与理赔申请相关的数据。

S2、根据所述理赔申请,获取理赔所需数据。

在具体应用中,所述理赔所需数据,可以包括:当前申请数据,历史理赔数据和保 单数据;

相应地,所述步骤S2可以包括:

用所述理赔申请的数据中的证件号码在预先存储的历史理赔数据库中进行匹配, 调取当前被保人的历史理赔数据;

用所述理赔申请的数据中的证件号码在预先存储的保单数据库中进行匹配,调取 当前被保人的保单数据。

其中,所述当前申请数据是指从原始申请数据中到处理赔审核所需数据,可以包 括:年龄、看病次数和每次看病的各项费用等,本实施例并不对其进行限制;所述每次看病 的各项费用,可以包括:药品费、诊疗费、住院费、挂号费、材料费、手术费和/或费等本 实施例并不对其进行限制。

其中,所述历史理赔数据,可以包括:历次理赔的时间、住院/诊治费用、诊治项目、 疾病代码和住院天数等,本实施例并不对其进行限制。

其中,所述保单数据,可以包括:保单信息、保险金额、保险余额、保险责任和起止 日期等,本实施例并不对其进行限制。

S3、根据所述理赔所需数据,判断是否调用预先建立的模型评分引擎和规则评分 引擎。

可以理解的是,在步骤S3判断是否调用预先建立的模型评分引擎和规则评分引擎 时,若所述理赔所需数据中缺失关键的理赔数据,申请资料不全,则直接做出不予受理的结 论,并确定不调用预先建立的模型评分引擎和规则评分引擎。

S4、若是,则基于所述理赔所需数据,调用所述模型评分引擎产生模型评分和风险 提示因子,以及调用所述规则评分引擎产生规则触发结果和规则风险评分。

S5、根据产生的模型评分、风险提示因子、规则触发结果和规则风险评分,生成风 险评估报告。

在具体应用中,所述风险评估报告,可以包括:综合评分,规则触发结果,赔案风险 等级,以及风险点提示等信息。

举例来说,本步骤可以根据风险评分对每个理赔申请排序,将赔案风险等级划分 为高中低三个等级,综合评分的最低分为0分,最高分为999分,其中,[800-999]为高风险, [500-800)为中风险,[0-500)为低风险。理赔审核人员可以把精力放在高风险的案件上,而 对于绝大多数的低风险赔案,进行快速赔付,从而大大提高理赔效率。

可以理解的是,所述风险提示因子为理赔审核员对高风险案例发起调查提供方向 指引。风险评估报告不但给出了风险评分,也给出了风险指引(即风险提示因子),可以帮助 理赔员有效的锁定风险点。

在具体应用中,评估报告可以是一个可视化的报告,可以通过弹窗显示或PDF文 档。报告索引为赔案号,报告内容包括综合评分,规则触发结果,赔案风险等级(高中低),以 及风险点提示。

S6、根据所述风险评估报告,获得最终是否理赔的结论,并将获得的理赔结论的理 赔数据存入历史理赔数据库。

可以理解的是,最终理赔的结论是根据评分结果,保险责任而决定的。低风险的案 例可以自动获得最终理赔的结论。高、中风险的案例则可以结合理赔审核人员输入的调查 结果做出最终理赔的结论。

可以理解的是,根据所述风险评估报告,获得最终不理赔的结论的情况可以包括: 出险不在保单有效期,事故不属保单责任等,本实施例并不对其进行限制,也可以包括其他 属于不理赔的情况。

本实施例的一种健康保险赔欺诈及滥用的侦测方法,通过接收用户设备提交的理 赔申请,根据所述理赔申请,获取理赔所需数据,根据所述理赔所需数据,判断是否调用预 先建立的模型评分引擎和规则评分引擎;若是,则基于所述理赔所需数据,调用所述模型评 分引擎产生模型评分和风险提示因子,以及调用所述规则评分引擎产生规则触发结果和规 则风险评分,根据产生的模型评分、风险提示因子、规则触发结果和规则风险评分,生成风 险评估报告,根据所述风险评估报告,获得最终是否理赔的结论,并将获得的理赔结论的理 赔数据存入历史理赔数据库,由此,能够实现对健康保险赔欺诈及滥用进行侦测,大大提高 了侦测的准确性和效率。

在具体应用中,所述模型评分引擎是基于历史理赔数据,采用无监督机器学习的 方法预先建立的用于进行健康保险欺诈或滥用探测的模型;

相应地,所述步骤S4中的“基于所述理赔所需数据,调用所述模型评分引擎产生模 型评分和风险提示因子”,可以包括图中未示出的步骤P1-P4:

P1、基于预设时间段内的历史理赔数据,产生分位数表,并存入更新预先建立的分 位数表数据库。

在具体应用中,所述步骤P1可以具体包括图中未示出的步骤Q1-Q3:

Q1、每隔预设时间段,从历史理赔数据中抽取所述预设时间段内的数据。

举例来说,所述预设时间段可以为过去2年,本实施例并不对其进行限制,可根据 实际情况进行具体设置。

进一步地,在从历史理赔数据中抽取所述预设时间段内的数据时,还可以对历史 理赔数据进行清洗,除去缺失数据和错误数据后,再从中抽取所述预设时间段内的数据。这 样所抽取的数据更准确。

Q2、基于所抽取的数据,对各类费用项的费用、住院天数、药品数,按疾病、年龄、险 种进行统计,产生(多个多维的)分位数表。

可以理解的是,分位数表是给正常赔案画像的主要数据,以疾病代码为基础,加上 索赔事故性质和年龄对健康保险所涵盖的医疗收费项目进行统计。

Q3、将本次产生的分位数表与预先建立的分位数表数据库中已有的分位数表进行 比对,利用本次产生的分位数表,对预先建立的分位数表数据库中已有的分位数表中有变 化的数据项进行更新存储。

可以理解的是,可以对分位数表按照疾病、年龄或责任等数据项进行索引,以便后 续使用。

可以理解的是,由于分位数表是由历史理赔数据产生,申请中受理的理赔数据一 旦处理完毕,就成为新近理赔数据。用新近理赔数据更新分位数表能够是模型自动学习新 的数据特征,比如同一疾病的药品收费随着新药的使用可能会有变化,定期自动更新分位 数表是提高模型准确性的重要一步。与所述分位数表产生过程的不同之处在于,所述分位 数表的更新过程包括:对历史数据库的更新,即新近理赔数据导入历史理赔数据库,和分位 数表在原有基础上的更新。这个更新不是简单地拿新的分位数表覆盖旧的分位数表,而是 对同一条目(entry),看有无更新数据,如无更新数据,则保留原有entry,如有新的数据,则 根据数据点的数量进行加权更新。

P2、从当前申请数据、历史理赔数据和本次产生的分位数表中提取特征变量,所述 特征变量从不同维度刻画了健康保险赔案的特征,所述特征变量根据数据来源分为住院/ 诊治类、收费收据类、历史理赔类、当前理赔类及其它类别。可以参考图2,图2中是利用特征 变量模块从当前申请数据、历史理赔数据和本次产生的分位数表中提取特征变量。

其中,所述不同维度,包括:索赔行为、医疗行为、诊疗项目、疾病诊断和/或药品项 目等,本实施例并不对其进行限制。

P3、采用无监督机器学习的方法,对所提取的特征变量进行学习,获得原始评分。 可以参考图2,图2中是利用无监督异常探测模型,采用无监督机器学习的方法,对所提取的 特征变量进行学习,获得原始评分。

其中,所述无监督机器学习的方法可以包括:聚类、主成分分析(PCA)和自编码网 络AutoEncoder模型等,本实施例并不对其进行限制,也可采用其他无监督机器学习的方 法。

可以理解的是,由于多数保险公司没有好的标签数据,所述模型评分引擎是无监 督模型,即通过学习历史理赔数据,从而掌握多数正常的赔案申请特征,通过所关心的赔案 的特征与机器学习得到的正常赔案特征的比较,从而定量地刻画当前赔案数据异常的几 率。数据异常几率越大,该赔案欺诈或滥用的风险越高。

在具体应用中,本步骤可以对这些数值化的特征变量进行如下转换:

X′=F(X)

其中,F(X)的关系由机器学习通过历史理赔数据获得。在PCA的方法中是线性转换 矩阵,在AutoEncoder的方法中是非线性的sigmoid函数的转换。

在具体应用中,本步骤可以通过下述公式给出原始评分p:

其中ΔX是数据的重建差值,μ是归一化因子,原始评分p为0到1之间的小数。

P4、通过评分校准,将所述原始评分的分布转化为预设分布范围内,获得最终的模 型评分和风险提示因子。

在具体应用中,举例来说,可以将原始评分p从小于1大于0的小数转化为0到1000 之间的整数。

可以理解的是,将所述原始评分的分布校准(转化)为预设分布范围内,可以使得 不同版本的评分可以进行比较。

可以理解的是,本实施例本发明采用PCA和AutoEncoder模型产生风险评分的同 时,也对高分(即高风险)案件产生风险提示因子。

在具体应用中,所述规则评分引擎是由一系列基于历史理赔数据、当前申请数据 和预先存储的药品/诊疗知识库数据而预先设置的专家规则组成;

相应地,所述步骤S4中的“调用所述规则评分引擎产生规则触发结果和规则风险 评分”,可以具体包括:

调用所述规则评分引擎,根据所述规则评分引擎中预先设置的专家规则,检查理 赔申请是否符合保险产品的要求,并对理赔申请的数据的完整性、准确性、一致性和逻辑性 进行规则判断,同时也对审核中发现的常见违规行为进行审核,输出规则检测结果。

其中,所述常见违规行为,可以包括:是否有已经索赔过的发票收据重复申请,病 人姓名与被保人姓名是否相符等,本实施例并不对其进行限制,也可以包括其他常见违规 行为。

可以理解的是,由于实际保险产品的不同,预先设置的专家规则也会不同,本实施 例所包含的规则可以预先存储于预先建立的规则库中,可根据具体保险产品的业务需要进 行具体调整。

可以理解的是,可以参考图3,所述输出规则检测结果可以包括:如果某一规则触 发,则把触发结果置为1,否则为0;每一条规则也有一个评分,该评分数值可以有业务专家 预先设定,也可以根据历史数据测试结果的阳性率来确定,阳性率越高,分值越高。一个赔 案可能触发过个规则,规则引擎给出一个总评分,该总评分是各个触发规则的加权平均获 得。

本实施例的健康保险赔欺诈及滥用的侦测方法,对健康保险理赔过程中的欺诈风 险采用机器学习模型与专家规则相结合,机器学习采用无监督学习,解决了许多保险公司 没有标签数据的建模困境。本实施例所述方法把健康理赔中的隐性欺诈风险通过机器学习 模型转化为显性风险,并通过风险评分量化风险等级。对于中高风险的索赔申请,可视化的 风险报告。风险评分对每个理赔申请排序,风险等级分为高(如评分为[500-800),中(如评 分为800-999),低(如评分为0-500)。理赔审核人员可以把精力放在高风险的案件上,而对 于绝大多数的低风险赔案,进行快速赔付,从而大大提高理赔效率。更重要的是,风险评估 报告不但给出了风险评分,也给出了风险指引(即风险提示因子),可以帮助理赔员有效的 锁定风险点。本实施例所述方法能够实现对健康保险赔欺诈及滥用进行侦测,大大提高了 侦测的准确性和效率。

图4示出了本发明一实施例提供的一种健康保险赔欺诈及滥用的侦测系统的结构 示意图,如图4所示,本实施例的健康保险赔欺诈及滥用的侦测系统,包括:接收模块41、数 据获取模块42、判断模块43、调用模块44、生成模块45和结论获取模块46;其中:

所述接收模块41,用于接收用户设备提交的理赔申请;

所述数据获取模块42,用于根据所述理赔申请,获取理赔所需数据;

所述判断模块43,用于根据所述理赔所需数据,判断是否调用预先建立的模型评 分引擎和规则评分引擎;

所述调用模块44,用于若判断得知要调用预先建立的模型评分引擎和规则评分引 擎,则基于所述理赔所需数据,调用所述模型评分引擎产生模型评分和风险提示因子,以及 调用所述规则评分引擎产生规则触发结果和规则风险评分;

所述生成模块45,用于根据产生的模型评分、风险提示因子、规则触发结果和规则 风险评分,生成风险评估报告;

所述结论获取模块46,用于根据所述风险评估报告,获得最终是否理赔的结论,并 将获得的理赔结论的理赔数据存入历史理赔数据库。

具体地,所述接收模块41接收用户设备提交的理赔申请;所述数据获取模块42根 据所述理赔申请,获取理赔所需数据;所述判断模块43根据所述理赔所需数据,判断是否调 用预先建立的模型评分引擎和规则评分引擎;所述调用模块44若判断得知要调用预先建立 的模型评分引擎和规则评分引擎,则基于所述理赔所需数据,调用所述模型评分引擎产生 模型评分和风险提示因子,以及调用所述规则评分引擎产生规则触发结果和规则风险评 分;所述生成模块45根据产生的模型评分、风险提示因子、规则触发结果和规则风险评分, 生成风险评估报告;所述结论获取模块46根据所述风险评估报告,获得最终是否理赔的结 论,并将获得的理赔结论的理赔数据存入历史理赔数据库。

需要说明的是,本实施例在接收用户设备提交的理赔申请后,可以对所述理赔申 请产生理赔申请唯一索引代码,对每次就医产生事件索引代码,对每个收据产生收据代码。

在具体应用中,所述理赔申请的数据可以包括:被保人姓名、证件号码、出生日期、 保单号、医生诊断书,处方、住院、诊治或药品的收据、医院名称及地址、诊治日期和住院日 期等,本实施例并不对其进行限制,也可以包括其他与理赔申请相关的数据。

在具体应用中,所述理赔所需数据,可以包括:当前申请数据,历史理赔数据和保 单数据;

相应地,所述数据获取模块42,可以具体用于

用所述理赔申请的数据中的证件号码在预先存储的历史理赔数据库中进行匹配, 调取当前被保人的历史理赔数据;

用所述理赔申请的数据中的证件号码在预先存储的保单数据库中进行匹配,调取 当前被保人的保单数据。

其中,所述当前申请数据是指从原始申请数据中到处理赔审核所需数据,可以包 括:年龄、看病次数和每次看病的各项费用等,本实施例并不对其进行限制;所述每次看病 的各项费用,可以包括:药品费、诊疗费、住院费、挂号费、材料费、手术费和/或费等本 实施例并不对其进行限制。

其中,所述历史理赔数据,可以包括:历次理赔的时间、住院/诊治费用、诊治项目、 疾病代码和住院天数等,本实施例并不对其进行限制。

其中,所述保单数据,可以包括:保单信息、保险金额、保险余额、保险责任和起止 日期等,本实施例并不对其进行限制。

可以理解的是,所述判断模块43在所述理赔所需数据不支持调用预先建立的模型 评分引擎和规则评分引擎时(即所述理赔所需数据中缺失关键的理赔数据,申请资料不 全),直接做出不予受理的结论,并确定不调用预先建立的模型评分引擎和规则评分引擎。

在具体应用中,所述风险评估报告,可以包括:综合评分,规则触发结果,赔案风险 等级,以及风险点提示等信息。

举例来说,所述生成模块45可以根据风险评分对每个理赔申请排序,将赔案风险 等级划分为高中低三个等级,综合评分的最低分为0分,最高分为999分,其中,[800-999]为 高风险,[500-800)为中风险,[0-500)为低风险。理赔审核人员可以把精力放在高风险的案 件上,而对于绝大多数的低风险赔案,进行快速赔付,从而大大提高理赔效率。

可以理解的是,所述风险提示因子为理赔审核员对高风险案例发起调查提供方向 指引。风险评估报告不但给出了风险评分,也给出了风险指引(即风险提示因子),可以帮助 理赔员有效的锁定风险点。

在具体应用中,评估报告可以是一个可视化的报告,可以通过弹窗显示或PDF文 档。报告索引为赔案号,报告内容包括综合评分,规则触发结果,赔案风险等级(高中低),以 及风险点提示。

可以理解的是,最终理赔的结论是根据评分结果,保险责任而决定的。低风险的案 例可以自动获得最终理赔的结论。高、中风险的案例则可以结合理赔审核人员输入的调查 结果做出最终理赔的结论。

可以理解的是,根据所述风险评估报告,获得最终不理赔的结论的情况可以包括: 出险不在保单有效期,事故不属保单责任等,本实施例并不对其进行限制,也可以包括其他 属于不理赔的情况。

本实施例的一种健康保险赔欺诈及滥用的侦测系统,利用预先建立的模型评分引 擎和规则评分引擎进行评分,能够实现对健康保险赔欺诈及滥用进行侦测,大大提高了侦 测的准确性和效率。

在具体应用中,所述模型评分引擎是基于历史理赔数据,采用无监督机器学习的 方法预先建立的用于进行健康保险欺诈或滥用探测的模型;

相应地,所述调用模块44可以基于预设时间段内的历史理赔数据,产生分位数表, 并存入更新预先建立的分位数表数据库;从当前申请数据、历史理赔数据和本次产生的分 位数表中提取特征变量,所述特征变量从不同维度刻画了健康保险赔案的特征,所述特征 变量根据数据来源分为住院/诊治类、收费收据类、历史理赔类、当前理赔类及其它类别;采 用无监督机器学习的方法,对所提取的特征变量进行学习,获得原始评分;通过评分校准, 将所述原始评分的分布转化为预设分布范围内,获得最终的模型评分和风险提示因子。

在具体应用中,所述规则评分引擎是由一系列基于历史理赔数据、当前申请数据 和预先存储的药品/诊疗知识库数据而预先设置的专家规则组成;

相应地,所述调用模块44可以调用所述规则评分引擎,根据所述规则评分引擎中 预先设置的专家规则,检查理赔申请是否符合保险产品的要求,并对理赔申请的数据的完 整性、准确性、一致性和逻辑性进行规则判断,同时也对审核中发现的常见违规行为进行审 核,输出规则检测结果。

本实施例的一种健康保险赔欺诈及滥用的侦测系统,可以用于执行前述方法实施 例的技术方案,其实现原理和技术效果类似,此处不再赘述。

本实施例的健康保险赔欺诈及滥用的侦测系统,对健康保险理赔过程中的欺诈风 险采用机器学习模型与专家规则相结合,机器学习采用无监督学习,解决了许多保险公司 没有标签数据的建模困境。本实施例把健康理赔中的隐性欺诈风险通过机器学习模型转化 为显性风险,并通过风险评分量化风险等级。对于中高风险的索赔申请,可视化的风险报 告。风险评分对每个理赔申请排序,风险等级分为高(如评分为[500-800),中(如评分为 800-999),低(如评分为0-500)。理赔审核人员可以把精力放在高风险的案件上,而对于绝 大多数的低风险赔案,进行快速赔付,从而大大提高理赔效率。更重要的是,风险评估报告 不但给出了风险评分,也给出了风险指引(即风险提示因子),可以帮助理赔员有效的锁定 风险点。本实施例所述系统能够实现对健康保险赔欺诈及滥用进行侦测,大大提高了侦测 的准确性和效率。

图5示出了本发明实施例提供的一种电子设备的实体结构示意图,如图5所示,该 电子设备可以包括:处理器11、存储器12、总线13及存储在存储器12上并可在处理器11上运 行的计算机程序;

其中,所述处理器11,存储器12通过所述总线13完成相互间的通信;

所述处理器11执行所述计算机程序时实现上述各方法实施例所提供的方法,例如 包括:接收用户设备提交的理赔申请;根据所述理赔申请,获取理赔所需数据;根据所述理 赔所需数据,判断是否调用预先建立的模型评分引擎和规则评分引擎;若判断得知要调用 预先建立的模型评分引擎和规则评分引擎,则基于所述理赔所需数据,调用所述模型评分 引擎产生模型评分和风险提示因子,以及调用所述规则评分引擎产生规则触发结果和规则 风险评分;根据产生的模型评分、风险提示因子、规则触发结果和规则风险评分,生成风险 评估报告;根据所述风险评估报告,获得最终是否理赔的结论,并将获得的理赔结论的理赔 数据存入历史理赔数据库。

本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该 计算机程序被处理器执行时实现上述各方法实施例所提供的方法,例如包括:接收用户设 备提交的理赔申请;根据所述理赔申请,获取理赔所需数据;根据所述理赔所需数据,判断 是否调用预先建立的模型评分引擎和规则评分引擎;若判断得知要调用预先建立的模型评 分引擎和规则评分引擎,则基于所述理赔所需数据,调用所述模型评分引擎产生模型评分 和风险提示因子,以及调用所述规则评分引擎产生规则触发结果和规则风险评分;根据产 生的模型评分、风险提示因子、规则触发结果和规则风险评分,生成风险评估报告;根据所 述风险评估报告,获得最终是否理赔的结论,并将获得的理赔结论的理赔数据存入历史理 赔数据库。

本领域内的技术人员应明白,本申请的实施例可提供为方法、装置/系统、或计算 机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方 面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的 计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机 程序产品的形式。

本申请是参照根据本申请实施例的方法、装置/系统、和计算机程序产品的流程图 和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程 和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指 令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生 一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现 在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置/系 统。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特 定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指 令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或 多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计 算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或 其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一 个方框或多个方框中指定的功能的步骤。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实 体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存 在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖 非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要 素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备 所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在 包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。术语“上”、“下”等指 示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化 描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操 作,因此不能理解为对本发明的限制。除非另有明确的规定和限定,术语“安装”、“相连”、 “连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是 机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个 元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本 发明中的具体含义。

本发明的说明书中,说明了大量具体细节。然而能够理解的是,本发明的实施例可 以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技 术,以便不模糊对本说明书的理解。类似地,应当理解,为了精简本发明公开并帮助理解各 个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特 征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解 释呈反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更 多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实 施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式, 其中每个权利要求本身都作为本发明的单独实施例。需要说明的是,在不冲突的情况下,本 申请中的实施例及实施例中的特征可以相互组合。本发明并不局限于任何单一的方面,也 不局限于任何单一的实施例,也不局限于这些方面和/或实施例的任意组合和/或置换。而 且,可以单独使用本发明的每个方面和/或实施例或者与一个或更多其他方面和/或其实施 例结合使用。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽 管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依 然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进 行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术 方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

本文发布于:2023-04-14 15:35:40,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/1/87250.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图