用户服务请求处理方法及装置、服务器、存储介质

阅读: 评论:0

著录项
  • CN202011402770.0
  • 20201202
  • CN112632995A
  • 20210409
  • 北京健康之家科技有限公司
  • 陶旭东;邱慧;张之弢
  • G06F40/295
  • G06F40/295 G16H10/60 G06N3/04 G06Q40/08

  • 北京市朝阳区利泽中二路2号C座二层201
  • 北京(11)
  • 北京汇思诚业知识产权代理有限公司
  • 周放
摘要
本申请提供一种用户服务请求处理方法及装置、服务器、存储介质,该方法可以获取用户已申请目标服务的申请信息以及所述用户的健康状态信息,其中,所述已申请目标服务的申请信息中包括第一时间,在所述用户的健康状态信息中提取疾病名称以及对应的患病时间。将所述患病时间与所述第一时间进行比较,若所述患病时间早于所述第一时间,则在所述已申请目标服务的申请信息中添加第一标签,若所述患病时间晚于所述第一时间,则在所述已申请目标服务的请求信息中添加第二标签。可以通过上述方式提高审核效率并避免通过人工审核在长时间工作后出现误判的问题。
权利要求

1.一种用户服务请求处理方法,其特征在于,所述方法包括:

获取用户已申请目标服务的申请信息以及所述用户的健康状态信息,其中,所述已申请目标服务的申请信息中包括第一时间;

在所述用户的健康状态信息中提取疾病名称以及对应的患病时间;

将所述患病时间与所述第一时间进行比较,若所述患病时间早于所述第一时间,则在所述已申请目标服务的申请信息中添加第一标签,若所述患病时间晚于所述第一时间,则在所述已申请目标服务的请求信息中添加第二标签。

2.根据权利要求1所述的方法,其特征在于,所述用户的健康状态信息包括所述用户的体检报告和/或所述用户的电子病历。

3.根据权利要求1所述的方法,其特征在于,所述获取所述用户的健康状态信息包括:

获取所述用户提交的所述健康状态信息;和/或

根据所述用户的用户信息在相应信息管理系统中获取所述用户的健康状态信息。

4.根据权利要求3所述的方法,其特征在于,所述根据所述用户的用户信息在相应信息管理系统获取用户的健康状态信息包括:

若确定所述用户年龄大于设定年龄,则根据所述用户的用户信息在相应信息管理系统获取用户的健康状态信息;或者

若确定所述用户提交的所述健康状态信息的检测时间在所述已申请目标服务的第一时间之后,则根据所述用户的用户信息在相应信息管理系统获取用户的健康状态信息。

5.根据权利要求1所述的方法,其特征在于,所述在所述用户的健康状态信息中提取疾病名称以及对应的患病时间包括:

基于字符识别技术对所述健康状态信息进行字符识别以得到健康状态文本信息;

基于实体识别模型在所述健康状态文本信息中识别出疾病名称以及对应的患病时间;

将所述疾病名称与设定疾病数据库进行匹配,获取匹配到的疾病名称并确定匹配到的所述疾病名称对应的患病时间。

6.根据权利要求5所述的方法,其特征在于,所述基于实体识别模型在所述健康状态文本信息中识别出疾病名称对应的患病时间包括:

基于规则引擎确定所述健康状态文本信息中疾病名称对应的患病时间。

7.根据权利要求6所述的方法,其特征在于,所述基于规则引擎确定所述健康状态文本信息中疾病名称对应的患病时间之后还包括:

若所述患病时间为相对时间,则将所述相对时间转换为绝对时间,并将转换得到的所述绝对时间作为所述患病时间。

8.一种用户服务请求处理装置,其特征在于,所述装置包括:

处理器和存储器,所述存储器用于存储至少一条指令,所述指令由所述处理器加载并执行时以实现如权利要求1-7中任意一项所述的用户服务请求处理方法。

9.一种服务器,其特征在于,所述服务器包括权利要求8所述的用户服务请求处理装置。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任意一项所述的用户服务请求处理方法。

说明书
技术领域

本发明涉及数据处理技术领域,尤其涉及一种用户服务请求处理方法及装置、服务器、存储介质。

随着保险保障行业的快速发展,如何准确的识别出投保人真实的患病时间是在投保前还是投保后,是投保人能否拥有投保资格以及能否获得赔付的关键。传统的解决方法只能人工审查判别,具体地,在理赔阶段,是通过由审核人员人工从投保人电子病历中到所患疾病和患病时间之间的匹配关系,并判断投保人是否具有理赔资格。然而上述人工审核方法效率低下,且随着审核人员的主观能动性,在长时间工作后有时候误判率也是很高的。

本发明实施例提供一种用户服务请求处理方法及装置、服务器、存储介质,通过该用户服务请求处理方法可以获取用户的健康状态信息,并通过字符识别将图片格式的上述健康状态信息转换为文本格式的健康状态文本信息,进一步通过自然语言处理提取得到健康状态文本信息中的疾病名称以及相应患病时间。通过对用户的疾病的患病时间和用户已申请目标服务申请信息中的第一时间进行比较,若确定疾病的患病时间早于第一时间,则在上述用户的已申请目标服务的申请信息中添加第一标签,反之,若确定上述疾病的患病时间晚于第一时间,则在上述用户的已申请目标服务的申请信息中添加第二标签。进而用户申请资格管理系统或人工审核的工作人员可以将用户已申请目标服务的申请信息中的上述标签(第一标签或第二标签)作为参考,以确定该用户是否具备申请目标服务的资格。可以通过上述方式提高审核效率并避免通过人工审核在长时间工作后出现误判的问题。

第一方面,本发明实施例提供一种用户服务请求处理方法,该方法包括:

获取用户已申请目标服务的申请信息以及所述用户的健康状态信息,其中,所述已申请目标服务的申请信息中包括第一时间;

在所述用户的健康状态信息中提取疾病名称以及对应的患病时间;

将所述患病时间与所述第一时间进行比较,若所述患病时间早于所述第一时间,则在所述已申请目标服务的申请信息中添加第一标签,若所述患病时间晚于所述第一时间,则在所述已申请目标服务的请求信息中添加第二标签。

进一步地,所述用户的健康状态信息包括所述用户的体检报告和/或所述用户的电子病历。

进一步地,所述获取所述用户的健康状态信息包括:

获取所述用户提交的所述健康状态信息;和/或

根据所述用户的用户信息在相应信息管理系统中获取所述用户的健康状态信息。

进一步地,所述根据所述用户的用户信息在相应信息管理系统获取用户的健康状态信息包括:

若确定所所述用户年龄大于设定年龄,则根据所述用户的用户信息在相应信息管理系统获取用户的健康状态信息;或者

若确定所述用户提交的所述健康状态信息的检测时间在第一时间之后,则根据所述用户的用户信息在相应信息管理系统获取用户的健康状态信息。

进一步地,所述在所述用户的健康状态信息中提取疾病名称以及对应的患病时间包括:

基于字符识别技术对所述健康状态信息进行字符识别以得到健康状态文本信息;

基于实体识别模型在所述健康状态文本信息中识别出疾病名称以及对应的患病时间;

将所述疾病名称与设定疾病数据库进行匹配,获取匹配到的疾病名称并确定匹配到的所述疾病名称对应的患病时间。

进一步地,所述基于实体识别模型在所述健康状态文本信息中识别出疾病名称包括:

按照BIEO标注方式对所述健康状态文本信息进行标注;

基于BiLSTM+CRF模型提取出经过所述BIEO标注的健康状态文本信息中的所述疾病名称。

进一步地,所述基于实体识别模型在所述健康状态文本信息中识别出疾病名称对应的患病时间包括:

基于规则引擎确定所述健康状态文本信息中疾病名称对应的患病时间。

进一步地,所述基于规则引擎确定所述健康状态文本信息中疾病名称对应的患病时间之后还包括:

若所述患病时间为相对时间,则将所述相对时间转换为绝对时间,并将转换得到的所述绝对时间作为所述患病时间。

进一步地,所述方法还包括:

若确定所述已申请目标服务的申请信息中携带有所述第一标签,则判定所述用户不具备理赔资格;

若确定所述已申请目标服务的申请信息中携带有所述第二标签,则判定所述用户具备理赔资格。

进一步地,在所述用户的健康状态信息中提取疾病名称以及对应的患病时间之前,还包括:

构建实体识别模型初始模型,利用训练文本对所述实体识别初始模型进行训练,并得到所述实体识别模型。

进一步地,所述构建实体识别初始模型,利用训练文本对所述实体识别初始模型进行训练,并得到所述实体识别模型包括:

采用BIEO标注方式对所述训练文本进行标注;

基于Bert预训练模型以及BiLSTM+CRF模型对所述经过所述BIEO标注的训练文本进行离线训练,并得到经过训练的实体识别初始模型;以及

对所述经过训练的实体识别初始模型进行测试,根据测试结果,将准确率大于设定准确率的所述经过训练的实体识别初始模型作为所述实体识别模型。

第二方面,本发明实施例还提供一种用户服务请求处理装置,包括:

处理器和存储器,所述存储器用于存储至少一条指令,所述指令由所述处理器加载并执行时以实现上述第一方面提供的用户服务请求处理方法。

第三方面,本发明实施例还提供一种服务器,包括:

上述第二方面提供的用户服务请求处理装置。

第四方面,本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面提供的用户服务请求处理方法。

通过上述技术方案,在获取用户的健康状态信息后,通过字符识别将图片格式的上述健康状态信息转换为文本格式的健康状态文本信息,进一步通过自然语言处理提取得到健康状态文本信息中的疾病名称以及相应患病时间。通过对用户的疾病的患病时间和用户已申请目标服务申请信息中的第一时间进行比较,若确定疾病的患病时间早于第一时间,则在上述用户的已申请目标服务的申请信息中添加第一标签,反之,若确定上述疾病的患病时间晚于第一时间则在上述用户的已申请目标服务的申请信息中添加第二标签。进而用户申请资格管理系统或人工审核的工作人员可以将用户已申请目标服务的申请信息中的上述标签(第一标签或第二标签)作为参考,以确定该用户是否具备申请目标服务的资格。

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的用户服务请求处理方法的流程示意图;

图2为本发明实施例提供的BIEO标注方式的标注示意图;

图3为本发明实施例提供的离线训练模型的流程示意图;

图4为本发明实施例提供的BiLSTM+CRF架构图;

图5为本发明实施例提供的用户服务请求处理系统架构示意图。

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1为本发明实施例提供的用户服务请求处理方法的流程示意图,如图1所示,该方法包括以下步骤:

步骤101:获取用户的已申请目标服务的申请信息以及所述用户的健康状态信息。

其中,可以在数据库中获取用户的已申请目标服务的申请信息,进而在已申请目标服务的申请信息中获取该目标服务的第一时间。目标服务可以为保险或互助理赔服务,进而第一时间可以为投保时间或加入互助时间。例如,该目标服务为一种健康保险,用户在A时间完成该健康保险的投保操作,用户在B时间基于上述健康保险提出理赔,上述B时间晚于上述A时间。根据步骤101的操作步骤,可以在数据库中获取该用户关于上述健康保险的投保信息,并根据该投保信息确定投保时间。

该用户的健康状态信息的获取方式包括:

第一获取方式:获取上述用户提交的本人健康状态信息。具体地,用户在请求已申请目标服务时,根据相应要求将提供一份本人的健康状态信息,即,可以获取用户在上述请求服务阶段提供的本人健康状态信息。

第二获取方式:在相应信息管理系统中获取用户的健康状态信息。具体地,可以根据已申请目标服务的申请信息确定对应用户的用户信息,并根据该用户信息在相应信息管理系统中获取该用户的健康状态信息。

在一种可实现的方式中,为减少目标服务平台的工作强度,可以将上述第一获取方式设置为默认获取方式,若基于上述第一获取方式进行用户的健康状态信息获取操作阶段出现异常情况后,可以通过上述第二获取方式获取用户的健康状态信息。其中,该异常情况包括:

第一情况:

在用户请求已申请目标服务阶段并确定该用户的年龄大于设定年龄。

在此情况下,目标服务平台可以认定该用户为超龄老人,不能在网络平台熟练的获取本人的健康状态信息,目标服务平台可以代为获取。具体地,用户在目标服务平台请求已申请目标服务时,平台确定该用户年龄大于设定年龄的情况下,目标服务平台可以向该用户发送提示消息,用户可以点击该提示消息中的选项,以选择是否需要平台代为获取健康状态信息。其中,若用户授权平台代为获取,该目标服务平台可以基于用户的身份信息以及已申请目标服务的相应文件在相应信息管理系统中获取该用户相应时间段内的健康状态信息。

第二情况:

用户提交的健康状态信息的检测时间在第一时间之后。

在此情况下,目标服务平台可以认定该用户提供的健康状态信息的时间覆盖度较低。举例来说,该目标服务为一种健康保险,用户在A时间完成该健康保险的投保操作,用户在B时间基于上述健康保险提出理赔,并且该用户在提出理赔后提供了该用户的健康状态信息。然而目标服务平台检测到该用户提供的该健康状态信息的检测时间均晚于A时间。为保证用户的健康状态信息的时间覆盖度,该目标服务平台可以基于用户的身份信息以及已申请目标服务的相应文件在相应信息管理系统中获取该用户相应时间段内的健康状态信息。

在一种可实现方式中,上述健康状态信息可以包括电子病历和/或体检报告。其中,该电子病历可以为用户在一家或多家医院的电子病历,该体检报告可以为用户在医院或体检中心的体检报告。目标服务平台若需获取用户的电子病历,则可以基于用户的身份信息以及已申请目标服务的相应文件在电子病历管理系统中获取该用户电子病历,同样的,若目标服务平台若需获取用户的体检报告,则可以基于用户的身份信息以及已申请目标服务的相应文件在体检报告管理系统获取该用户的体检报告。

在一种可实现方式中,可以同时采用上述第一获取方式和第二获取方式获取用户的健康状态信息。

上述电子病历可以包括用户曾经就诊的各个医院同步上传至电子病历管理系统的电子病历,且该电子病历具体可以包括门诊电子病历和住院电子病历。

步骤102:在上述用户的健康状态信息中提取疾病名称以及对应的患病时间。

其中,上述步骤101中获取到的电子病历可以为图片格式或PDF格式,在获取到上述电子病历后可以基于字符识别技术(如OCR,optical character recognition光学字符识别)将图片格式或PDF格式电子病历识别为文本形式,并将OCR识别出来的文本重新组合为一段病历文本。若获取到的用户的电子病历中包括住院电子病历,可以对住院电子病历相应的病历文本进行分类处理,具体可以分类为住院记录和出院记录分别处理。

案例(考虑用户隐私以及方便举例和书写,这里简化了电子病历和其格式):

姓名:王某;

入院时间:2020-3-15

现病史:患者于2周前心脏病突发入院。

既往史:无。

提取后结果:{现病史:[{2020-3-1:心脏病}]}

其中,根据在上述电子病历中识别得到的字符信息,可以确定患者王某的入院时间为2020-3-15,提取到的疾病名称为心脏病,患病时间为相对于入院时间的2周前。基于实体识别模型内部的规则引擎,可以将上述相对时间转换为绝对时间,即,患者王某的患病时间为2020-3-1,实体识别模型输出识别结果:患者王某的{现病史:[{2020-3-1:心脏病}]}。

步骤103:将步骤102中提取到的疾病的患病时间与步骤101中获取的目标服务的第一时间进行比较,若上述患病时间早于上述第一时间,则在上述用户目标服务申请信息中添加第一标签,若所述患病时间晚于所述第一时间,则在所述上述用户的目标服务请求信息中添加第二标签。

其中,若用户(上述王某)的目标服务第一时间为2020-3-20,则可以确定王某患疾病(上述心脏病)的时间早于第一时间(如健康保险的投保时间)。进一步地,可以在王某的目标服务申请信息中添加第一标签,并将添加了上述第一标签的王某的目标服务申请信息存储在目标服务平台的数据库中,后续用户申请资格管理系统或人工审核的工作人员可以对上述数据库中添加标签的目标服务申请信息进行审核,可以将用户目标服务申请信息中的上述标签(第一标签或第二标签)作为参考,以确定该用户是否具备申请目标服务的资格。具体地,上述王某的目标服务申请信息中的标签为第一标签,针对王某的目标服务申请的审核结果为:在先患有疾病(心脏病),不具备理赔资格。

在本实施例中,上述步骤102-103为本申请提供的实体识别模型所执行的,且在执行上述步骤102之前还可以构建上述实体识别模型,且该实体识别模型的构建流程如下:

1、对识别到的病历文本进行序列标注,可以采用BIEO的标注方式进行标注。

BIEO标注方式中的BIEO是Begin(开头),Intermediate(中间),End(结尾),Other(其它)四个单词的首字母。BIEO标注方式即标注出各个分词属于某一个命名实体的开头、中间或结尾,或者属于其它。

图2为本发明实施例提供的BIEO标注方式的标注示意图,如图2所示,对病历文本数据进行的BIEO格式标注中,具体地,B-DISEASE:某一个疾病的开始字符,I-DISEASE:某一个疾病的中间字符,E-DISEASE:某一个疾病的结尾字符,O:非疾病字符,S:疾病为单个字。

如图2所示,电子病历中的疾病名称“胃黏膜病变”被分割为“胃”、“黏”、“膜”、“病”、“变”这五个字符后,根据分词的上下文特征可以确定“胃”的命名实体标注信息为“B-DISEASE”,“黏”、“膜”、“病”的命名实体标注信息为“I-DISEASE”,“变”的命名实体标注信息为“E-DISEASE”。

2、基于BiLSTM+CRF的实体识别模型离线训练

图3为本发明实施例提供的离线训练模型的流程示意图,如图3所示,上述基于BiLSTM+CRF的实体识别模型离线训练包括以下流程:

2.1、对病历文本数据进行探索性分析。

上述探索性分析主要为分析文本长度的分布,在进行实体识别时选择合适大小的文本长度切割文本有利于提高模型准确度。一般病历中的文本长度分布在1000左右,所以最好的情况是保留文本长度为1000来做阶段。由于Bert支持的最长序列长度为512。所以本实施例中采用512个序列长度作为文本截断长度。

2.2、Bert预训练模型加载。

本方案的疾病实体识别部分也加载了Bert中文预训练模型。其中,在加载Bert预训练模型,并基于Bert预训练模型映射得到所述训练文本中每个字符的字向量。进而可以在Bert后面接Bilstm和CRF完成医疗疾病命名实体识别任务。

2.3、实体识别模型训练

图4为本发明实施例提供的BiLSTM+CRF架构图,如图4所示,将模型在GPU上训练,根据数据集和本业务确定最优的训练轮数为20轮,每一次将训练文本输入后被Bert转化为向量的格式。入模型训练的数据为N*M,N为BATCH_SIZE大小,M为向量纬度大小。经Bert映射后的词向量输入进入双向的LSTM神经网络学习,学习后的向量进一步传入到条件随机场(Conditional Random Fields,CRF)结构中学习。CRF处理序列标注问题需要计算条件概率,采用最大似然方法通过维比特算法计算得到最终的类别概率。

2.4、模型调参和优化验证

对上述经过训练的实体识别初始模型进行测试,根据测试结果,将准确率大于设定准确率的所述经过训练的实体识别初始模型作为所述实体识别模型。

图5为本发明实施例提供的用户服务请求处理系统架构示意图,如图5所示,具体地上述用户服务请求处理系统可以包括业务应用层、模型服务层以及数据存储层。

其中,该数据存储层进行数据存储,具体可以以MySQL、txt、图片的方式进行存储文件。

该模型服务层可以提供OCR图片转文本服务、病历文本分类服务、文本实体识别服务以及时间-疾病检索匹配服务。

该业务应用层可以对模型服务层提供的时间-疾病信息中提取相应的疾病-患病时间信息,并基于疾病的患病时间与用户目标服务第一时间的比较结果对用户的目标服务申请信息打上相应标签,以使后续审核作业中可以参考用户的目标服务申请信息中的标签进行相应申请资格审核操作。

本发明实施例还提供一种用户服务请求处理装置,该装置包括处理器和存储器,所述存储器用于存储至少一条指令,所述指令由所述处理器加载并执行时以实现图1所示的实施例中的用户服务请求处理方法。

本发明实施例还提供一种服务器,且该服务器可以包括上述用户服务请求处理装置。

本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现图1所示的实施例中的用户服务请求处理方法。

需要说明的是,本发明实施例中所涉及的终端可以包括但不限于个人计算机(Personal Computer,PC)、个人数字助理(Personal Digital Assistant,PDA)、无线手持设备、平板电脑(Tablet Computer)、手机、MP3播放器、MP4播放器等。

可以理解的是,所述应用可以是安装在终端上的应用程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本发明实施例对此不进行限定。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

本文发布于:2023-04-13 12:15:36,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/1/86482.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图