1.本发明涉及
数据处理技术领域,尤其涉及一种
医疗大数据采集方法、装置、设备及存储介质。
背景技术:
2.目前,人们越来越认识到数据的重要性,随着互联网技术的发展,大数据也被应用到各领域,例如广告领域、电商领域和智能交通领域等,促进了各领域朝着智能化的方向发展,目前医疗数据领域也借助大数据技术实现智能化改造,但是医疗数据不同于其他数据,不仅涉及到用户的隐私,而且数据庞杂,采集到的数据占用巨量存储空间,采集到的大多数数据无法直接使用,若存储不当还有可能造成用户隐私泄露。
3.上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
技术实现要素:
4.本发明的主要目的在于提供了一种医疗大数据采集方法、装置、设备及存储介质,旨在解决现有技术中医疗数据占用存储空间大且后续无法直接使用的技术问题。
5.为实现上述目的,本发明提供了一种医疗大数据采集方法,
所述方法包括以下步骤:
6.在采集医疗数据时,对初始医疗数据进行识别,根据识别结果确定所述初始医疗数据对应的疾病类型;
7.在所述疾病类型为第一类型疾病时,从所述初始医疗数据中提取患者信息,根据所述患者信息将所述初始医疗数据存储至临时存储区,所述临时存储区内的数据间隔预设时长被清理一次;
8.在所述疾病类型为第二类型疾病时,通过所述第二类型疾病对应的数据处理方式对所述初始医疗数据进行
标准化处理,获得标准医疗数据;
9.根据所述标准医疗数据确定所述第二类型疾病的数据安全等级,并根据所述数据安全等级确定数据加密算法;
10.根据所述标准医疗数据确定标准患者信息,根据所述标准患者信息和所述数据加密算法将所述标准医疗数据加密,获得加密标准医疗数据;
11.将所述加密标准医疗数据存储至永久存储区。
12.可选地,所述在所述疾病类型为第一类型疾病时,从所述初始医疗数据中提取患者信息,根据所述患者信息将所述初始医疗数据存储至临时存储区,包括:
13.在所述疾病类型为第一类型疾病时,从所述初始医疗数据中提取患者信息,对所述患者信息进行关键词识别,根据关键词识别的结果确定所述患者信息中各数据片段的数据可靠度等级;
14.将数据可靠度等级最高的数据片段设定为所述初始医疗数据的加密秘钥;
15.根据所述加密秘钥,通过对称加密算法将所述初始医疗数据加密,获得加密初始医疗数据;
16.将所述加密初始医疗数据存储至临时存储区。
17.可选地,所述在所述疾病类型为第二类型疾病时,通过所述第二类型疾病对应的数据处理方式对所述初始医疗数据进行标准化处理,获得标准医疗数据,包括:
18.在所述疾病类型为第二类型疾病时,获取与所述第二类型疾病对应的目标数据格式;
19.从所述初始医疗数据中提取若干数据关键词,并确定各数据关键词对应的相似关键词;
20.根据各数据关键词和对应的相似关键词构建若干关键词集;
21.将所述若干关键词集中的关键词依次与所述目标数据格式中的格式关键词进行匹配;
22.在关键词集合中存在与所述格式关键词匹配的关键词时,将所述初始医疗数据中与所述数据关键词对应的医疗数据片段填入与所述格式关键词对应的位置,直至各关键词集完成匹配,获得标准医疗数据。
23.可选地,所述根据所述标准医疗数据确定所述第二类型疾病的数据安全等级,并根据所述数据安全等级确定数据加密算法,包括:
24.从所述标准医疗数据中提取所述第二类型疾病的疾病名称、本次药品数量和本次诊疗费用;
25.根据所述疾病名称确定所述第二类型疾病对应的平均药品数量和平均诊疗费用;
26.在所述本次药品数量大于所述平均药品数量和/或所述本次诊疗费用大于所述平均诊疗费用时,根据所述本次药品数量、所述本次诊疗费用和预设权重确定数据安全等级;
27.根据预设映射关系确定与所述数据安全等级对应的数据加密算法,在所述预设映射关系中,高数据安全等级对应高安全性的数据加密算法。
28.可选地,所述根据所述标准医疗数据确定标准患者信息,根据所述标准患者信息和所述数据加密算法将所述标准医疗数据加密,获得加密标准医疗数据,包括:
29.根据所述标准患者信息确定所述标准医疗数据的标准数据标识字段;
30.根据所述标准数据标识字段,通过所述数据加密算法将所述标准医疗数据加密,获得加密标准医疗数据。
31.可选地,所述将所述加密标准医疗数据存储至永久存储区之后,还包括:
32.从所述永久存储区读取n个历史加密标准医疗数据;
33.将所述n个历史加密标准医疗数据解密,获得n个历史标准医疗数据;
34.从所述n个历史标准医疗数据中读取n个历史诊疗时间、n个历史健康度和n个历史诊疗费用;
35.将所述n个历史诊疗时间和对应的n个历史诊疗费用映射至时间费用坐标系,获得n个时间费用坐标点;
36.通过最小二乘法对所述n个时间费用坐标点进行拟合,获得预设费用预测算法;
37.将所述n个历史诊疗费用和对应的n个历史健康度映射至费用健康度坐标系,获得n个费用健康度坐标点;
38.通过最小二乘法对所述n个费用健康度坐标点进行拟合,获得预设健康度预测算法。
39.可选地,所述通过最小二乘法对所述n个费用健康度坐标点进行拟合,获得预设健康度预测算法之后,还包括:
40.获取患者输入的预测时间信息;
41.将所述预测时间信息输入与所述患者对应的预设费用预测算法,获得与所述患者对应的预测诊疗费用;
42.将所述预测诊疗费用输入所述预设健康度预测算法,获得所述患者的预测健康度。
43.此外,为实现上述目的,本发明还提出一种医疗大数据采集装置,所述装置包括:
44.识别模块,用于在采集医疗数据时,对初始医疗数据进行识别,根据识别结果确定所述初始医疗数据对应的疾病类型;
45.临时存储模块,用于在所述疾病类型为第一类型疾病时,从所述初始医疗数据中提取患者信息,根据所述患者信息将所述初始医疗数据存储至临时存储区,所述临时存储区内的数据间隔预设时长被清理一次;
46.标准化处理模块,用于在所述疾病类型为第二类型疾病时,通过所述第二类型疾病对应的数据处理方式对所述初始医疗数据进行标准化处理,获得标准医疗数据;
47.确定模块,用于根据所述标准医疗数据确定所述第二类型疾病的数据安全等级,并根据所述数据安全等级确定数据加密算法;
48.加密模块,用于根据所述标准医疗数据确定标准患者信息,根据所述标准患者信息和所述数据加密算法将所述标准医疗数据加密,获得加密标准医疗数据;
49.存储模块,用于将所述加密标准医疗数据存储至永久存储区。
50.此外,为实现上述目的,本发明还提出一种医疗大数据采集设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的医疗大数据采集程序,所述医疗大数据采集程序配置为实现如上文所述的医疗大数据采集方法的步骤。
51.此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有医疗大数据采集程序,所述医疗大数据采集程序被处理器执行时实现如上文所述的医疗大数据采集方法的步骤。
52.本发明在采集医疗数据时,对初始医疗数据进行识别,根据识别结果确定所述初始医疗数据对应的疾病类型;在所述疾病类型为第一类型疾病时,从所述初始医疗数据中提取患者信息,根据所述患者信息将所述初始医疗数据存储至临时存储区,所述临时存储区内的数据间隔预设时长被清理一次;在所述疾病类型为第二类型疾病时,通过所述第二类型疾病对应的数据处理方式对所述初始医疗数据进行标准化处理,获得标准医疗数据;根据所述标准医疗数据确定所述第二类型疾病的数据安全等级,并根据所述数据安全等级确定数据加密算法;根据所述标准医疗数据确定标准患者信息,根据所述标准患者信息和所述数据加密算法将所述标准医疗数据加密,获得加密标准医疗数据;将所述加密标准医疗数据存储至永久存储区。本发明在初始医疗数据对应的疾病类型为第一疾病类型时,将初始医疗数据存储至临时存储区,在初始医疗数据对应的疾病类型为第二类型疾病时,将初始医疗数据处理为标准医疗数据,再根据标准医疗数据的数据安全等级确定的数据加密
算法将标准医疗数据加密,获得加密标准医疗数据,并将加密标准医疗数据存储至永久存储区,由于临时存储区间隔预设时间清理依次,能够节省存储空间,并且存储至永久存储区域的是加密标准医疗数据,后续只需经过解密即可直接使用,在节省存储空间的同时提高了后续数据使用的便利性。
附图说明
53.图1是本发明实施例方案涉及的硬件运行环境的医疗大数据采集设备的结构示意图;
54.图2为本发明医疗大数据采集方法第一实施例的流程示意图;
55.图3为本发明医疗大数据采集方法第二实施例的流程示意图;
56.图4为本发明医疗大数据采集方法第三实施例的流程示意图;
57.图5为本发明医疗大数据采集装置第一实施例的结构框图。
58.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
59.应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
60.参照图1,图1为本发明实施例方案涉及的硬件运行环境的医疗大数据采集设备结构示意图。
61.如图1所示,该医疗大数据采集设备可以包括:处理器1001,例如中央处理器(central processing unit,cpu),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(wireless-fidelity,wi-fi)接口)。存储器1005可以是高速的随机存取存储器(random access memory,ram),也可以是稳定的非易失性存储器(non-volatile memory,nvm),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
62.本领域技术人员可以理解,图1中示出的结构并不构成对医疗大数据采集设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
63.如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及医疗大数据采集程序。
64.在图1所示的医疗大数据采集设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明医疗大数据采集设备中的处理器1001、存储器1005可以设置在医疗大数据采集设备中,所述医疗大数据采集设备通过处理器1001调用存储器1005中存储的医疗大数据采集程序,并执行本发明实施例提供的医疗大数据采集方法。
65.本发明实施例提供了一种医疗大数据采集方法,参照图2,图2为本发明医疗大数据采集方法第一实施例的流程示意图。
66.本实施例中,所述医疗大数据采集方法包括以下步骤:
67.步骤s10:在采集医疗数据时,对初始医疗数据进行识别,根据识别结果确定所述
初始医疗数据对应的疾病类型。
68.需要说明的是,本实施例的执行主体可以是一种具有数据处理、网络通信以及程序运行功能的计算服务设备,例如平板电脑、个人电脑、手机等,或者是一种能够实现上述功能的电子设备、医疗大数据采集设备等。以下以医疗大数据采集设备为例,对本实施例及下述各实施例进行举例说明。
69.可以理解的是,初始医疗数据可以是从产生医疗数据的设备上采集到的未经处理的医疗数据,初始医疗数据可以是电子病历数据、健康检测数据和体检数据等,本实施例中以初始医疗数据为电子病历数据为例进行举例说明;对初始医疗数据进行识别可以是根据初始电子病历数据的来源确定产生电子病历数据的医疗机构名称,根据医疗机构名称在医疗机构数据库中查该医疗机构名称对应的目标疾病名称位置,根据目标疾病名称位置在电子病历数据中对应的位置识别初始电子病历数据中的疾病名称。
70.应该理解的是,根据识别结果确定所述初始医疗数据对应的疾病类型可以是根据识别获得的疾病名称在预设疾病库中进行匹配,根据匹配结果确定初始电子病历数据对应的疾病类型。
71.步骤s20:在所述疾病类型为第一类型疾病时,从所述初始医疗数据中提取患者信息,根据所述患者信息将所述初始医疗数据存储至临时存储区,所述临时存储区内的数据间隔预设时长被清理一次。
72.可以理解的是,第一类型疾病可以是历史医疗数据对后续的诊断贡献低的疾病,例如第一类型疾病可以是感冒、骨折、头疼等,即第一类型疾病不具有持续性,经过一次可痊愈,历史数据对后续的诊断无法提供参考的疾病;患者信息可以是能够表示患者身份的信息;根据所述患者信息将所述初始医疗数据存储至临时存储区可以是根据患者信息对初始医疗数据进行对称加密,将加密后的初始医疗数据存储至临时存储区;临时存储区中的数据间隔预设时长被清理依次,在清理临时存储区内的数据时,可以按照数据的优先级先清理优先级低的数据,再清理优先级高的数据。
73.步骤s30:在所述疾病类型为第二类型疾病时,通过所述第二类型疾病对应的数据处理方式对所述初始医疗数据进行标准化处理,获得标准医疗数据。
74.可以理解的是,第二类型疾病可以是历史医疗数据对后续的诊断能够提供参考依据的疾病,例如第二类型疾病可以是高血压、糖尿病等,即第二类型疾病具有持续性,需要长时间用药,历史医疗数据可为后续的诊断提供参考依据的疾病。
75.可以理解的是,第二类型疾病包括多种疾病,不同的疾病需要关注的身体指标数据不同,因此为预先根据不同疾病需要关注的身体指标数据,为各数据预先设置对应的数据标准格式,将初始医疗数据中的映射至数据标准格式中获得对应的标准医疗数据,而初始医疗数据中未映射至数据标准格式中的数据可存储至临时存储区,或直接将未映射至数据标准格式中的数据丢弃,以节省存储空间。
76.步骤s40:根据所述标准医疗数据确定所述第二类型疾病的数据安全等级,并根据所述数据安全等级确定数据加密算法。
77.可以理解的是,不同疾病对应的标准医疗数据包含的用户隐私数据的重要程度不同,若都采用安全性高的加密算法,则会降低加密速度,增加资源占用率,因此为不同数据安全等级的标准医疗数据分配对应的数据加密算法;根据所述标准医疗数据确定所述第二
类型疾病的数据安全等级,并根据所述数据安全等级确定数据加密算法可以是获取标准医疗数据中用户的若干隐私数据,根据各隐私数据的权重计算数据安全等级,根据数据安全等级在安全等级加密算法映射关系中获取对应的数据加密算法。
78.应该理解的是,确定第二类型疾病的数据安全等级的具体方式可以是:从标准医疗数据中获取用户的m个隐私数据,根据预设赋值权重表确定各隐私数据的初始赋值和各隐私数据的数据权重,将各初始赋值和对应的数据权重相乘后求和获得第二类型疾病的最终赋值,将最终赋值与若干预设值进行对比,根据对比结果确定数据安全等级;例如某第二类型疾病的最终赋值为15,预设值为5、8、11、14和17,最终赋值处于14和15之间,则可确定该第二类型疾病的数据安全等级为5级。
79.在本实施例中,例如安全等级加密算法映射关系可参照表1,假设某一时刻需要对两个标准医疗数据a和b进行加密,根据a中的隐私数据和权重计算得到数据安全等级为2,根据b中的隐私数据和权重计算得到的数据安全等级为5,则与a数据对应的数据加密算法为3des算法,与b数据对应的数据加密算法为rsa算法。
80.表1
[0081][0082][0083]
步骤s50:根据所述标准医疗数据确定标准患者信息,根据所述标准患者信息和所述数据加密算法将所述标准医疗数据加密,获得加密标准医疗数据。
[0084]
可以理解的是,标准患者信息可以是标准医疗数据中留存的患者信息,例如标准患者信息包括身份证号、手机号和名字等信息;根据所述标准患者信息和所述数据加密算法将所述标准医疗数据加密可以是通过数据加密算法将标准医疗数据加密,并根据标准患者信息将对医疗数据加密时产生的秘钥进行加密。
[0085]
步骤s60:将所述加密标准医疗数据存储至永久存储区。
[0086]
可以理解的是,永久存储区可以是在无相关操作权限的人员删除数据时,加密后的标准医疗数据永久保存的存储区域。
[0087]
进一步地,为了提高数据的安全性,所述步骤s20,包括:在所述疾病类型为第一类型疾病时,从所述初始医疗数据中提取患者信息,对所述患者信息进行关键词识别,根据关键词识别的结果确定所述患者信息中各数据片段的数据可靠度等级;将数据可靠度等级最高的数据片段设定为所述初始医疗数据的加密秘钥;根据所述加密秘钥,通过对称加密算法将所述初始医疗数据加密,获得加密初始医疗数据;将所述加密初始医疗数据存储至临时存储区。
[0088]
可以理解的是,患者信息包括身份证号、手机号、名字、家庭住址、年龄、职业、性别和民族等信息;可靠度等级可以是患者信息能够代表患者身份的等级,身份证号能够唯一
表示患者的身份,因此可靠度等级最高,标准医疗数据中的手机号可能不是患者本人的手机号,因此可靠度等级低于身份证号,其余的例如名字、年龄和职业等信息,与其他人的信息重复度高,因此可靠度等级低。
[0089]
在本实施例中,从初始医疗数据中提取患者信息,对患者信息进行关键词识别,假设在患者信息中识别出身份证号这一关键词,则将身份证号对应的数据最为加密秘钥。
[0090]
本实施例在采集医疗数据时,对初始医疗数据进行识别,根据识别结果确定所述初始医疗数据对应的疾病类型;在所述疾病类型为第一类型疾病时,从所述初始医疗数据中提取患者信息,根据所述患者信息将所述初始医疗数据存储至临时存储区,所述临时存储区内的数据间隔预设时长被清理一次;在所述疾病类型为第二类型疾病时,通过所述第二类型疾病对应的数据处理方式对所述初始医疗数据进行标准化处理,获得标准医疗数据;根据所述标准医疗数据确定所述第二类型疾病的数据安全等级,并根据所述数据安全等级确定数据加密算法;根据所述标准医疗数据确定标准患者信息,根据所述标准患者信息和所述数据加密算法将所述标准医疗数据加密,获得加密标准医疗数据;将所述加密标准医疗数据存储至永久存储区。本实施例在初始医疗数据对应的疾病类型为第一疾病类型时,将初始医疗数据存储至临时存储区,在初始医疗数据对应的疾病类型为第二类型疾病时,将初始医疗数据处理为标准医疗数据,再根据标准医疗数据的数据安全等级确定的数据加密算法将标准医疗数据加密,获得加密标准医疗数据,并将加密标准医疗数据存储至永久存储区,由于临时存储区间隔预设时间清理依次,能够节省存储空间,并且存储至永久存储区域的是加密标准医疗数据,后续只需经过解密即可直接使用,在节省存储空间的同时提高了后续数据使用的便利性。
[0091]
参考图3,图3为本发明医疗大数据采集方法第二实施例的流程示意图。
[0092]
基于上述第一实施例,在本实施例中,所述步骤s30包括:
[0093]
步骤s301:在所述疾病类型为第二类型疾病时,获取与所述第二类型疾病对应的目标数据格式。
[0094]
可以理解的是,目标数据格式可以是预先设置的第二类型疾病对应的数据格式,目标数据格式包括数据头和数据存储位,例如数据头包括姓名、身份证号、电话、药品种类、药品数量、诊疗费用等,数据存储位中存储的即是上述数据头对应的具体数据。
[0095]
步骤s302:从所述初始医疗数据中提取若干数据关键词,并确定各数据关键词对应的相似关键词。
[0096]
可以理解的是,数据关键词可以是初始医疗数据中的关键词,例如数据关键词包括姓名、年龄、就诊科室、诊疗费用、药品种类、药品数量和住院天数等;相似关键词可以是与数据关键词表达的含义相同但是具体形式不同的关键词,例如数据关键词为姓名,则对应的相似关键词可以是名字;由于不同医疗机构之间的表述可能不同,因此在本实施例中确定各数据关键词对应的相似关键词。
[0097]
应该理解的是,确定各数据关键词对应的相似关键词的方式可以是将数据关键词与预设医疗关键词数据库进行匹配,根据匹配结果确定对应的相似关键词;预设医疗关键词库的构建方式可以是:确定产生初始医疗数据的医疗机构,收集各医疗机构的电子病历表,从各医疗机构的电子病历表中提取医疗关键词,将具有相同含义的医疗关键词存储至同一子数据单元中,获得预设医疗关键词库,若新增加产生初始医疗数据的医疗机构,可根
据该医疗机构的电子病历表对预设医疗关键词库进行更新。
[0098]
步骤s303:根据各数据关键词和对应的相似关键词构建若干关键词集。
[0099]
可以理解的是,关键词集中包括数据关键词和与数据关键词对应的若干相似关键词;例如有5个数据关键词,则对应有5个关键词集。
[0100]
步骤s304:将所述若干关键词集中的关键词依次与所述目标数据格式中的格式关键词进行匹配。
[0101]
在本实施例中,格式关键词可以是目标数据格式中的关键词;将关键词集中的关键词依次与目标数据格式中格式关键词进行匹配,若某一关键词集中存在与格式关键词匹配成功的关键词,则判定对应的关键词集匹配成功。
[0102]
步骤s305:在关键词集合中存在与所述格式关键词匹配的关键词时,将所述初始医疗数据中与所述数据关键词对应的医疗数据片段填入与所述格式关键词对应的位置,直至各关键词集完成匹配,获得标准医疗数据。
[0103]
可以理解的是,在关键词集合中存在与格式关键词匹配成功的关键词时,判定关键词集合中数据关键词对应的医疗数据片段为有效医疗数据片段,此时将该有效医疗数据片段存储至与格式关键词对应的位置;例如某数据关键词为用药数量,相似关键词用药量、药品量,则关键词集包括用药数量、用药量和药品量,格式关键词为药品量,则该关键词集与格式关键词匹配成功,此时将初始医疗数据中用药量对应的医疗数据片段填入格式关键词药品量对应的位置。
[0104]
应该理解的是,初始医疗数据中的某些数据是无用数据,不需要存储,为了节省存储空间,若某关键词集与格式关键词匹配失败,则将对应数据关键词的医疗数据片段丢弃。
[0105]
进一步地,为了在提高数据安全性的同时提高数据加密效率,所述步骤s40,包括:从所述标准医疗数据中提取所述第二类型疾病的疾病名称、本次药品数量和本次诊疗费用;根据所述疾病名称确定所述第二类型疾病对应的平均药品数量和平均诊疗费用;在所述本次药品数量大于所述平均药品数量和/或所述本次诊疗费用大于所述平均诊疗费用时,根据所述本次药品数量、所述本次诊疗费用和预设权重确定数据安全等级;根据预设映射关系确定与所述数据安全等级对应的数据加密算法,在所述预设映射关系中,高数据安全等级对应高安全性的数据加密算法。
[0106]
在本实施例中,在所述本次药品数量大于所述平均药品数量和/或所述本次诊疗费用大于所述平均诊疗费用时,判定对应患者的患病程度重,对应的医疗数据的数据安全等级较高;根据所述本次药品数量、所述本次诊疗费用和预设权重确定数据安全等级可以是根据预设赋值表确定本次药品数量对应的初始药品赋值,根据预设赋值表确定本次诊疗费用对应的初始费用赋值,初始药品赋值与药品权重的乘积加上初始费用赋值与费用权重的积获得最终赋值,根据预设等级表和最终赋值确定数据安全等级;预设赋值表中存储有药品数量与药片赋值和诊疗费用与费用赋值的对应关系,预设等级表中存储有最终赋值与数据安全等级的对应关系。
[0107]
进一步地,为了提高数据的安全性,所述步骤s50,包括:根据所述标准患者信息确定所述标准医疗数据的标准数据标识字段;根据所述标准数据标识字段,通过所述数据加密算法将所述标准医疗数据加密,获得加密标准医疗数据。
[0108]
可以理解的是,标准数据标识字段可以是能唯一表示患者身份是字段,例如身份
证号、手机号等;在通过数据加密算法加密标准医疗数据时,引入标准数据标识字段,以提高数据的安全性。
[0109]
本实施例在所述疾病类型为第二类型疾病时,获取与所述第二类型疾病对应的目标数据格式;从所述初始医疗数据中提取若干数据关键词,并确定各数据关键词对应的相似关键词;根据各数据关键词和对应的相似关键词构建若干关键词集;将所述若干关键词集中的关键词依次与所述目标数据格式中的格式关键词进行匹配;在关键词集合中存在与所述格式关键词匹配的关键词时,将所述初始医疗数据中与所述数据关键词对应的医疗数据片段填入与所述格式关键词对应的位置,直至各关键词集完成匹配,获得标准医疗数据。本实施例通过数据关键词和相似关键词将初始医疗数据中的医疗数据片段映射至目标数据格式中,并将匹配失败的数据关键词对应的医疗数据片段丢弃,提高了匹配的准确度,在提高标准医疗数据准确度的同时节省了存储空间。
[0110]
参考图4,图4为本发明医疗大数据采集方法第三实施例的流程示意图。
[0111]
基于上述各实施例,在本实施例中,所述步骤s60之后,所述方法还包括:
[0112]
步骤s70:从所述永久存储区读取n个历史加密标准医疗数据。
[0113]
可以理解的是,n为正整数;历史加密标准医疗数据可以是曾将采集的某一患者的加密标准医疗数据。
[0114]
步骤s80:将所述n个历史加密标准医疗数据解密,获得n个历史标准医疗数据;
[0115]
步骤s90:从所述n个历史标准医疗数据中读取n个历史诊疗时间、n个历史健康度和n个历史诊疗费用。
[0116]
可以理解的是,历史诊疗时间可以是患者的就诊时间;历史健康度可以是患者在该次就诊时的身体健康状况;历史诊疗费用可以是患者该次就诊的费用。
[0117]
步骤s100:将所述n个历史诊疗时间和对应的n个历史诊疗费用映射至时间费用坐标系,获得n个时间费用坐标点。
[0118]
可以理解的是,时间费用坐标系可以是以时间为横坐标,诊疗费用为纵坐标建立的坐标系;时间费用坐标点可以是n个历史诊疗时间和对应的n个历史诊疗费用在时间费用坐标系中的坐标点。
[0119]
步骤s110:通过最小二乘法对所述n个时间费用坐标点进行拟合,获得预设费用预测算法。
[0120]
可以理解的是,预设费用预测算法可以是通过最小二乘法拟合获得的数学公式,将时间输入预设费用预测算法可获得该时间对应的预测诊疗费用。
[0121]
步骤s120:将所述n个历史诊疗费用和对应的n个历史健康度映射至费用健康度坐标系,获得n个费用健康度坐标点。
[0122]
可以理解的是,费用健康度坐标系可以是以诊疗费用为横坐标,健康度为纵坐标建立的坐标系;费用健康度坐标点可以是n个历史诊疗费用和对应的n个历史健康度在费用健康度坐标系中的坐标点。
[0123]
步骤s130:通过最小二乘法对所述n个费用健康度坐标点进行拟合,获得预设健康度预测算法。
[0124]
可以理解的是,预设健康度预测算法可以是通过最小二乘法拟合获得的数学公式,将预测诊疗费用输入预设健康度预测算法可获得预测诊疗费用对应的预测健康度。
[0125]
在本实施例中,可将预设费用预测算法与预设健康度预测算法封装,获得预设预测算法,将时间输入该预测算法即可获得对应的预测健康度。
[0126]
进一步地,为了对患者身体状况做出预测,所述步骤s130之后,还包括:获取患者输入的预测时间信息;将所述预测时间信息输入与所述患者对应的预设费用预测算法,获得与所述患者对应的预测诊疗费用;将所述预测诊疗费用输入所述预设健康度预测算法,获得所述患者的预测健康度。
[0127]
本实施例从所述永久存储区读取n个历史加密标准医疗数据;将所述n个历史加密标准医疗数据解密,获得n个历史标准医疗数据;从所述n个历史标准医疗数据中读取n个历史诊疗时间、n个历史健康度和n个历史诊疗费用;将所述n个历史诊疗时间和对应的n个历史诊疗费用映射至时间费用坐标系,获得n个时间费用坐标点;通过最小二乘法对所述n个时间费用坐标点进行拟合,获得预设费用预测算法;将所述n个历史诊疗费用和对应的n个历史健康度映射至费用健康度坐标系,获得n个费用健康度坐标点;通过最小二乘法对所述n个费用健康度坐标点进行拟合,获得预设健康度预测算法。本实施例建立了预设费用预测算法和预设健康度预测算法,后续能通过输入的时间对患者的健康度进行预测,能够对后续的诊疗提供参考依据。
[0128]
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有医疗大数据采集程序,所述医疗大数据采集程序被处理器执行时实现如上文所述的医疗大数据采集方法的步骤。
[0129]
参照图5,图5为本发明医疗大数据采集装置第一实施例的结构框图。
[0130]
如图5所示,本发明实施例提出的医疗大数据采集装置包括:
[0131]
识别模块10,用于在采集医疗数据时,对初始医疗数据进行识别,根据识别结果确定所述初始医疗数据对应的疾病类型;
[0132]
临时存储模块20,用于在所述疾病类型为第一类型疾病时,从所述初始医疗数据中提取患者信息,根据所述患者信息将所述初始医疗数据存储至临时存储区,所述临时存储区内的数据间隔预设时长被清理一次;
[0133]
标准化处理模块30,用于在所述疾病类型为第二类型疾病时,通过所述第二类型疾病对应的数据处理方式对所述初始医疗数据进行标准化处理,获得标准医疗数据;
[0134]
确定模块40,用于根据所述标准医疗数据确定所述第二类型疾病的数据安全等级,并根据所述数据安全等级确定数据加密算法;
[0135]
加密模块50,用于根据所述标准医疗数据确定标准患者信息,根据所述标准患者信息和所述数据加密算法将所述标准医疗数据加密,获得加密标准医疗数据;
[0136]
存储模块60,用于将所述加密标准医疗数据存储至永久存储区。
[0137]
本实施例在采集医疗数据时,对初始医疗数据进行识别,根据识别结果确定所述初始医疗数据对应的疾病类型;在所述疾病类型为第一类型疾病时,从所述初始医疗数据中提取患者信息,根据所述患者信息将所述初始医疗数据存储至临时存储区,所述临时存储区内的数据间隔预设时长被清理一次;在所述疾病类型为第二类型疾病时,通过所述第二类型疾病对应的数据处理方式对所述初始医疗数据进行标准化处理,获得标准医疗数据;根据所述标准医疗数据确定所述第二类型疾病的数据安全等级,并根据所述数据安全等级确定数据加密算法;根据所述标准医疗数据确定标准患者信息,根据所述标准患者信
息和所述数据加密算法将所述标准医疗数据加密,获得加密标准医疗数据;将所述加密标准医疗数据存储至永久存储区。本实施例在初始医疗数据对应的疾病类型为第一疾病类型时,将初始医疗数据存储至临时存储区,在初始医疗数据对应的疾病类型为第二类型疾病时,将初始医疗数据处理为标准医疗数据,再根据标准医疗数据的数据安全等级确定的数据加密算法将标准医疗数据加密,获得加密标准医疗数据,并将加密标准医疗数据存储至永久存储区,由于临时存储区间隔预设时间清理依次,能够节省存储空间,并且存储至永久存储区域的是加密标准医疗数据,后续只需经过解密即可直接使用,在节省存储空间的同时提高了后续数据使用的便利性。
[0138]
基于本发明上述医疗大数据采集装置第一实施例,提出本发明医疗大数据采集装置的第二实施例。
[0139]
在本实施例中,所述临时存储模块20,还用于在所述疾病类型为第一类型疾病时,从所述初始医疗数据中提取患者信息,对所述患者信息进行关键词识别,根据关键词识别的结果确定所述患者信息中各数据片段的数据可靠度等级;将数据可靠度等级最高的数据片段设定为所述初始医疗数据的加密秘钥;根据所述加密秘钥,通过对称加密算法将所述初始医疗数据加密,获得加密初始医疗数据;将所述加密初始医疗数据存储至临时存储区。
[0140]
所述标准化处理模块30,还用于在所述疾病类型为第二类型疾病时,获取与所述第二类型疾病对应的目标数据格式;从所述初始医疗数据中提取若干数据关键词,并确定各数据关键词对应的相似关键词;根据各数据关键词和对应的相似关键词构建若干关键词集;将所述若干关键词集中的关键词依次与所述目标数据格式中的格式关键词进行匹配;在关键词集合中存在与所述格式关键词匹配的关键词时,将所述初始医疗数据中与所述数据关键词对应的医疗数据片段填入与所述格式关键词对应的位置,直至各关键词集完成匹配,获得标准医疗数据。
[0141]
所述确定模块40,还用于从所述标准医疗数据中提取所述第二类型疾病的疾病名称、本次药品数量和本次诊疗费用;根据所述疾病名称确定所述第二类型疾病对应的平均药品数量和平均诊疗费用;在所述本次药品数量大于所述平均药品数量和/或所述本次诊疗费用大于所述平均诊疗费用时,根据所述本次药品数量、所述本次诊疗费用和预设权重确定数据安全等级;根据预设映射关系确定与所述数据安全等级对应的数据加密算法,在所述预设映射关系中,高数据安全等级对应高安全性的数据加密算法。
[0142]
所述加密模块50,还用于根据所述标准患者信息确定所述标准医疗数据的标准数据标识字段;根据所述标准数据标识字段,通过所述数据加密算法将所述标准医疗数据加密,获得加密标准医疗数据。
[0143]
所述存储模块60,还用于从所述永久存储区读取n个历史加密标准医疗数据;将所述n个历史加密标准医疗数据解密,获得n个历史标准医疗数据;从所述n个历史标准医疗数据中读取n个历史诊疗时间、n个历史健康度和n个历史诊疗费用;将所述n个历史诊疗时间和对应的n个历史诊疗费用映射至时间费用坐标系,获得n个时间费用坐标点;通过最小二乘法对所述n个时间费用坐标点进行拟合,获得预设费用预测算法;将所述n个历史诊疗费用和对应的n个历史健康度映射至费用健康度坐标系,获得n个费用健康度坐标点;通过最小二乘法对所述n个费用健康度坐标点进行拟合,获得预设健康度预测算法。
[0144]
所述存储模块60,还用于获取患者输入的预测时间信息;将所述预测时间信息输
入与所述患者对应的预设费用预测算法,获得与所述患者对应的预测诊疗费用;将所述预测诊疗费用输入所述预设健康度预测算法,获得所述患者的预测健康度。
[0145]
本发明医疗大数据采集装置的其他实施例或具体实现方式可参照上述各方法实施例,此处不再赘述。
[0146]
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
[0147]
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0148]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器/随机存取存储器、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
[0149]
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
技术特征:
1.一种医疗大数据采集方法,其特征在于,所述方法包括:在采集医疗数据时,对初始医疗数据进行识别,根据识别结果确定所述初始医疗数据对应的疾病类型;在所述疾病类型为第一类型疾病时,从所述初始医疗数据中提取患者信息,根据所述患者信息将所述初始医疗数据存储至临时存储区,所述临时存储区内的数据间隔预设时长被清理一次;在所述疾病类型为第二类型疾病时,通过所述第二类型疾病对应的数据处理方式对所述初始医疗数据进行标准化处理,获得标准医疗数据;根据所述标准医疗数据确定所述第二类型疾病的数据安全等级,并根据所述数据安全等级确定数据加密算法;根据所述标准医疗数据确定标准患者信息,根据所述标准患者信息和所述数据加密算法将所述标准医疗数据加密,获得加密标准医疗数据;将所述加密标准医疗数据存储至永久存储区。2.如权利要求1所述的方法,其特征在于,所述在所述疾病类型为第一类型疾病时,从所述初始医疗数据中提取患者信息,根据所述患者信息将所述初始医疗数据存储至临时存储区,包括:在所述疾病类型为第一类型疾病时,从所述初始医疗数据中提取患者信息,对所述患者信息进行关键词识别,根据关键词识别的结果确定所述患者信息中各数据片段的数据可靠度等级;将数据可靠度等级最高的数据片段设定为所述初始医疗数据的加密秘钥;根据所述加密秘钥,通过对称加密算法将所述初始医疗数据加密,获得加密初始医疗数据;将所述加密初始医疗数据存储至临时存储区。3.如权利要求1所述的方法,其特征在于,所述在所述疾病类型为第二类型疾病时,通过所述第二类型疾病对应的数据处理方式对所述初始医疗数据进行标准化处理,获得标准医疗数据,包括:在所述疾病类型为第二类型疾病时,获取与所述第二类型疾病对应的目标数据格式;从所述初始医疗数据中提取若干数据关键词,并确定各数据关键词对应的相似关键词;根据各数据关键词和对应的相似关键词构建若干关键词集;将所述若干关键词集中的关键词依次与所述目标数据格式中的格式关键词进行匹配;在关键词集合中存在与所述格式关键词匹配的关键词时,将所述初始医疗数据中与所述数据关键词对应的医疗数据片段填入与所述格式关键词对应的位置,直至各关键词集完成匹配,获得标准医疗数据。4.如权利要求1所述的方法,其特征在于,所述根据所述标准医疗数据确定所述第二类型疾病的数据安全等级,并根据所述数据安全等级确定数据加密算法,包括:从所述标准医疗数据中提取所述第二类型疾病的疾病名称、本次药品数量和本次诊疗费用;根据所述疾病名称确定所述第二类型疾病对应的平均药品数量和平均诊疗费用;
在所述本次药品数量大于所述平均药品数量和/或所述本次诊疗费用大于所述平均诊疗费用时,根据所述本次药品数量、所述本次诊疗费用和预设权重确定数据安全等级;根据预设映射关系确定与所述数据安全等级对应的数据加密算法,在所述预设映射关系中,高数据安全等级对应高安全性的数据加密算法。5.如权利要求1所述的方法,其特征在于,所述根据所述标准医疗数据确定标准患者信息,根据所述标准患者信息和所述数据加密算法将所述标准医疗数据加密,获得加密标准医疗数据,包括:根据所述标准患者信息确定所述标准医疗数据的标准数据标识字段;根据所述标准数据标识字段,通过所述数据加密算法将所述标准医疗数据加密,获得加密标准医疗数据。6.如权利要求1-5任一项所述的方法,其特征在于,所述将所述加密标准医疗数据存储至永久存储区之后,还包括:从所述永久存储区读取n个历史加密标准医疗数据;将所述n个历史加密标准医疗数据解密,获得n个历史标准医疗数据;从所述n个历史标准医疗数据中读取n个历史诊疗时间、n个历史健康度和n个历史诊疗费用;将所述n个历史诊疗时间和对应的n个历史诊疗费用映射至时间费用坐标系,获得n个时间费用坐标点;通过最小二乘法对所述n个时间费用坐标点进行拟合,获得预设费用预测算法;将所述n个历史诊疗费用和对应的n个历史健康度映射至费用健康度坐标系,获得n个费用健康度坐标点;通过最小二乘法对所述n个费用健康度坐标点进行拟合,获得预设健康度预测算法。7.如权利要求6所述的方法,其特征在于,所述通过最小二乘法对所述n个费用健康度坐标点进行拟合,获得预设健康度预测算法之后,还包括:获取患者输入的预测时间信息;将所述预测时间信息输入与所述患者对应的预设费用预测算法,获得与所述患者对应的预测诊疗费用;将所述预测诊疗费用输入所述预设健康度预测算法,获得所述患者的预测健康度。8.一种医疗大数据采集装置,其特征在于,所述装置包括:识别模块,用于在采集医疗数据时,对初始医疗数据进行识别,根据识别结果确定所述初始医疗数据对应的疾病类型;临时存储模块,用于在所述疾病类型为第一类型疾病时,从所述初始医疗数据中提取患者信息,根据所述患者信息将所述初始医疗数据存储至临时存储区,所述临时存储区内的数据间隔预设时长被清理一次;标准化处理模块,用于在所述疾病类型为第二类型疾病时,通过所述第二类型疾病对应的数据处理方式对所述初始医疗数据进行标准化处理,获得标准医疗数据;确定模块,用于根据所述标准医疗数据确定所述第二类型疾病的数据安全等级,并根据所述数据安全等级确定数据加密算法;加密模块,用于根据所述标准医疗数据确定标准患者信息,根据所述标准患者信息和
所述数据加密算法将所述标准医疗数据加密,获得加密标准医疗数据;存储模块,用于将所述加密标准医疗数据存储至永久存储区。9.一种医疗大数据采集设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的医疗大数据采集程序,所述医疗大数据采集程序配置为实现如权利要求1至7中任一项所述的医疗大数据采集方法的步骤。10.一种存储介质,其特征在于,所述存储介质上存储有医疗大数据采集程序,所述医疗大数据采集程序被处理器执行时实现如权利要求1至7任一项所述的医疗大数据采集方法的步骤。
技术总结
本发明公开了一种医疗大数据采集方法、装置、设备及存储介质,包括:对初始医疗数据进行识别,根据识别结果确定对应的疾病类型;在疾病类型为第一类型疾病时,提取患者信息,根据患者信息将所述初始医疗数据存储至临时存储区;在疾病类型为第二类型疾病时,通过第二类型疾病对应的数据处理方式对初始医疗数据进行标准化处理,获得标准医疗数据;根据标准医疗数据确定第二类型疾病的数据安全等级,并根据数据安全等级确定数据加密算法;根据标准医疗数据确定标准患者信息,根据标准患者信息和数据加密算法将标准医疗数据加密,获得加密标准医疗数据;将加密标准医疗数据存储至永久存储区。在节省存储空间的同时提高了后续数据使用的便利性。用的便利性。用的便利性。
技术研发人员:
董磊 李勇 王丽 李永冠 盛炳森 孙国庆
受保护的技术使用者:
山东水发紫光大数据有限责任公司
技术研发日:
2022.08.22
技术公布日:
2022/11/25