数据的处理方法和装置、电子设备与流程

阅读: 评论:0



1.本发明涉及数据处理技术领域,具体而言,涉及一种数据的处理方法和装置、电子设备。


背景技术:



2.对就诊数据或者医疗保险数据进行存储和管理是至关重要的,就诊数据中最重要的信息便是诊断。不同地区不同等级不同医院的诊断可能采用不同的诊断标准,甚至同一医院不同科室也采用不同的标准,如icd9、icd10、中医诊断、中医证候等。现有技术中对于不同的医疗诊断数据通过人工的方式进行匹配汇总,存在处理效率低的问题。
3.针对上述相关技术中对于不同的医疗诊断数据通过人工的方式进行匹配汇总,导致匹配效率比较低的问题,目前尚未提出有效的解决方案。


技术实现要素:



4.本发明实施例提供了一种数据的处理方法和装置、电子设备,以至少解决相关技术中对于不同的医疗诊断数据通过人工的方式进行匹配汇总,导致匹配效率比较低的技术问题。
5.根据本发明实施例的一个方面,提供了一种数据的处理方法,包括:获取待处理的医疗诊断数据,其中,所述待处理的医疗诊断数据中至少包括以下之一:待处理的诊断名称和待处理的诊断名称对应的诊断代码;将所述待处理的诊断名称或待处理的诊断名称对应的诊断代码,与目标诊断条目库进行等值匹配,得到匹配结果,其中,所述目标诊断条目库中包括目标诊断条目,所述目标诊断条目中包括标准诊断代码和所述标准诊断代码对应的标准诊断名称;若所述匹配结果指示匹配成功,则从所述目标诊断条目库中的目标诊断条目确定所述待处理的医疗诊断数据对应的标准诊断数据。
6.进一步地,所述目标诊断条目库通过以下步骤建立:从预设的存储区域中确定多个第一诊断条目库和基础诊断条目库,其中,所述第一诊断条目库中包括多个诊断条目,所述诊断条目由诊断代码和所述诊断代码对应的诊断名称组成;依据所述诊断代码或所述诊断代码对应的诊断名称,将每个第一诊断条目库中的每个诊断条目与所述基础诊断条目库中的每个诊断条目进行等值匹配,得到多个第一诊断集和第二诊断集,其中,每个第一诊断集由所述每个第一诊断条目库中未与所述基础诊断条目库中的诊断条目匹配上的多个第一诊断条目组成,所述第二诊断集由所述基础诊断条目库中未与所述第一诊断条目库中的诊断条目匹配上的多个第二诊断条目组成;分别对每个第一诊断集中的诊断数据与所述第二诊断集中的诊断数据进行相似度计算,得到多个目标相似度值,并依据所述多个目标相似度值,构建所述每个第一诊断集与所述第二诊断集之间的多个二部图;依据所述多个二部图对所述基础诊断条目库进行扩充,得到目标诊断条目库。
7.进一步地,分别对每个第一诊断集中的诊断数据与所述第二诊断集中的诊断数据进行相似度计算,得到多个目标相似度值包括:对所述每个第一诊断集中的第一诊断条目
进行分词,并基于分词后的第一诊断条目建立第一索引表;建立所述第二诊断集中的第二诊断条目对应的第二索引表;依据所述第一索引表得到待处理的第一诊断条目的第一索引字符,并依据所述第二索引表得到待处理的第二诊断条目的第二索引字符;依据所述第一索引字符和所述第二索引字符,分别对每个第一诊断集中的诊断数据与所述第二诊断集中的诊断数据进行相似度计算,得到所述多个目标相似度值。
8.进一步地,依据所述第一索引字符和所述第二索引字符,分别对每个第一诊断集中的诊断数据与所述第二诊断集中的诊断数据进行相似度计算,得到所述多个目标相似度值包括:依据所述第一索引字符和所述第二索引表对所述第二诊断集中的第二诊断条目进行筛选,得到第一候选诊断集,并计算所述待处理的第一诊断条目与所述第一候选诊断集中的诊断条目的相似度,得到多个第一目标相似度值;依据所述第二索引字符和所述第一索引表对所述第一诊断集中的第一诊断条目进行筛选,得到第二候选诊断集,并计算所述待处理的第二诊断条目与所述第二候选诊断集中的诊断条目的相似度,得到多个第二目标相似度值;将所述多个第一目标相似度值和所述多个第二目标相似度值作为所述多个目标相似度值。
9.进一步地,计算所述待处理的第一诊断条目与所述第一候选诊断集中的诊断条目的相似度,得到多个第一目标相似度值包括:计算所述待处理的第一诊断条目与所述第一候选诊断集中的诊断条目的最长公共子序列,得到多个第一初始相似度值;计算所述待处理的第一诊断条目与所述第一候选诊断集中的诊断条目的杰卡德相似系数,得到多个第二初始相似度值;对所述多个第一初始相似度值和所述多个第二初始相似度值进行准确度优化,得到多个优化后的第一初始相似度值和多个优化后的第二初始相似度值;分别依据每个优化后的第一初始相似度值和每个优化后的第二初始相似度值,得到所述多个第一目标相似度值。
10.进一步地,对所述多个第一初始相似度值和所述多个第二初始相似度值进行准确度优化,得到多个优化后的第一初始相似度值和多个优化后的第二初始相似度值包括:依据诊断条目中的目标词语,构建与所述目标词语对应的词语集;依据所述目标词语对应的词语集对所述多个第一初始相似度值和所述多个第二初始相似度值进行准确度优化,得到所述多个优化后的第一初始相似度值和所述多个优化后的第二初始相似度值。
11.进一步地,依据所述多个目标相似度值,构建所述每个第一诊断集与所述第二诊断集之间的多个二部图包括:从所述多个第一目标相似度值中选取最大的相似度值,将所述最大的相似度值对应的所述第一候选诊断集中的诊断条目作为目标诊断条目;判断所述目标诊断条目和所述待处理的第一诊断条目是否满足判断准则中的任意一条准则;若所述目标诊断条目和所述待处理的第一诊断条目满足判断准则中的任意一条准则,则表示所述目标诊断条目与所述待处理的第一诊断条目之间有边连接;若所述目标诊断条目和所述待处理的第一诊断条目不满足判断准则中的任意一条准则,则表示所述待处理的第一诊断条目未匹配成功,所述待处理的第一诊断条目与所述第二诊断条目没有边连接;确定所述待处理的第二诊断条目与所述第二候选诊断集中的诊断条目之间的有边连接和所述待处理的第二诊断条目与所述第一诊断条目之间的没有边连接;依据有边连接和没有边连接,得到所述每个第一诊断集与所述第二诊断集之间的多个二部图。
12.进一步地,所述判断准则至少包括以下准则:准则一:优化后的第一初始相似度值
大于等于第一预设值;准则二:优化后的第二初始相似度值大于等于第二预设值;准则三:在所述目标诊断条目是所述待处理的第一诊断条目的子字符串的情况下,所述优化后的第一初始相似度值大于等于第三预设值,或者,在所述待处理的第一诊断条目是所述目标诊断条目是子字符串的情况下,所述优化后的第一初始相似度值大于等于所述第三预设值;准则四:在所述目标诊断条目是所述待处理的第一诊断条目的子序列的情况下,所述优化后的第一初始相似度值大于等于所述第三预设值,或者,在所述待处理的第一诊断条目是所述目标诊断条目是子序列的情况下,所述优化后的第一初始相似度值大于等于所述第三预设值;准则五:在所述目标诊断条目是所述待处理的第一诊断条目的子字符串的情况下,所述优化后的第二初始相似度值大于等于第四预设值,或者,在所述待处理的第一诊断条目是所述目标诊断条目是子字符串的情况下,所述优化后的第二初始相似度值大于等于所述第四预设值;准则六:在所述目标诊断条目是所述待处理的第一诊断条目的子序列的情况下,所述优化后的第二初始相似度值大于等于所述第四预设值,或者,在所述待处理的第一诊断条目是所述目标诊断条目是子序列的情况下,所述优化后的第二初始相似度值大于等于所述第四预设值。
13.进一步地,依据所述多个二部图对所述基础诊断条目库进行扩充,得到目标诊断条目库包括:依据未匹配的第一诊断条目对所述基础诊断条目库进行扩充;若存在一一匹配的第一诊断条目和第二诊断条目,则将所述第一诊断条目作为与所述第一诊断条目一对一匹配的第二诊断条目的别名,并扩充到所述基础诊断条目库中;若存在非一一匹配的第一诊断条目和第二诊断条目,则选择值最高相似度值对应的第一诊断条目对所述基础诊断条目库进行扩充;将扩充后的基础诊断条目库作为所述目标诊断条目库。
14.进一步地,所述方法还包括:若所述匹配结果指示未匹配成功,则对所述待处理的医疗诊断数据进行分词,得到第三索引字符;建立所述目标诊断条目库的索引库;依据所述第三索引字符和所述索引库,对所述目标诊断条目库中的目标诊断条目进行筛选,得到第三候选诊断集;计算所述待处理的医疗诊断数据与所述第三候选诊断集的第三目标相似度值,并基于所述第三目标相似度值,从所述第三候选诊断集中的目标诊断条目确定所述待处理的医疗诊断数据对应的标准诊断数据。
15.根据本发明实施例的另一方面,还提供了一种数据的处理方法,包括:获取客户端发送待处理的医疗诊断数据,其中,所述待处理的医疗诊断数据中至少包括以下之一:待处理的诊断名称和待处理的诊断名称对应的诊断代码;在云端服务器中将所述待处理的诊断名称或待处理的诊断名称对应的诊断代码,与目标诊断条目库进行等值匹配,得到匹配结果,其中,所述目标诊断条目库中包括目标诊断条目,所述目标诊断条目中包括标准诊断代码和所述标准诊断代码对应的标准诊断名称,若所述匹配结果指示匹配成功,则从所述目标诊断条目库中的目标诊断条目确定所述待处理的医疗诊断数据对应的标准诊断数据;将所述待处理的医疗诊断数据对应的标准诊断数据返回至所述客户端。
16.根据本发明实施例的另一方面,还提供了一种数据的处理装置,包括:第一获取单元,用于获取待处理的医疗诊断数据,其中,所述待处理的医疗诊断数据中至少包括以下之一:待处理的诊断名称和待处理的诊断名称对应的诊断代码;第一匹配单元,用于将所述待处理的诊断名称或待处理的诊断名称对应的诊断代码,与目标诊断条目库进行等值匹配,得到匹配结果,其中,所述目标诊断条目库中包括目标诊断条目,所述目标诊断条目中包括
标准诊断代码和所述标准诊断代码对应的标准诊断名称;第一确定单元,用于若所述匹配结果指示匹配成功,则从所述目标诊断条目库中的目标诊断条目确定所述待处理的医疗诊断数据对应的标准诊断数据。
17.进一步地,所述目标诊断条目库通过以下步骤建立:第二确定单元,用于从预设的存储区域中确定多个第一诊断条目库和基础诊断条目库,其中,所述第一诊断条目库中包括多个诊断条目,所述诊断条目由诊断代码和所述诊断代码对应的诊断名称组成;第二匹配单元,用于依据所述诊断代码或所述诊断代码对应的诊断名称,将每个第一诊断条目库中的每个诊断条目与所述基础诊断条目库中的每个诊断条目进行等值匹配,得到多个第一诊断集和第二诊断集,其中,每个第一诊断集由所述每个第一诊断条目库中未与所述基础诊断条目库中的诊断条目匹配上的多个第一诊断条目组成,所述第二诊断集由所述基础诊断条目库中未与所述第一诊断条目库中的诊断条目匹配上的多个第二诊断条目组成;第一计算单元,用于分别对每个第一诊断集中的诊断数据与所述第二诊断集中的诊断数据进行相似度计算,得到多个目标相似度值,并依据所述多个目标相似度值,构建所述每个第一诊断集与所述第二诊断集之间的多个二部图;扩充单元,用于依据所述多个二部图对所述基础诊断条目库进行扩充,得到目标诊断条目库。
18.进一步地,所述第一计算单元包括:分词子单元,用于对所述每个第一诊断集中的第一诊断条目进行分词,并基于分词后的第一诊断条目建立第一索引表;建立子单元,用于建立所述第二诊断集中的第二诊断条目对应的第二索引表;第一处理子单元,用于依据所述第一索引表得到待处理的第一诊断条目的第一索引字符,并依据所述第二索引表得到待处理的第二诊断条目的第二索引字符;计算子单元,用于依据所述第一索引字符和所述第二索引字符,分别对每个第一诊断集中的诊断数据与所述第二诊断集中的诊断数据进行相似度计算,得到所述多个目标相似度值。
19.进一步地,所述计算子单元包括:第一筛选模块,用于依据所述第一索引字符和所述第二索引表对所述第二诊断集中的第二诊断条目进行筛选,得到第一候选诊断集,并计算所述待处理的第一诊断条目与所述第一候选诊断集中的诊断条目的相似度,得到多个第一目标相似度值;第二筛选模块,用于依据所述第二索引字符和所述第一索引表对所述第一诊断集中的第一诊断条目进行筛选,得到第二候选诊断集,并计算所述待处理的第二诊断条目与所述第二候选诊断集中的诊断条目的相似度,得到多个第二目标相似度值;确定模块,用于将所述多个第一目标相似度值和所述多个第二目标相似度值作为所述多个目标相似度值。
20.进一步地,所述第一筛选模块包括:第一计算子模块,用于计算所述待处理的第一诊断条目与所述第一候选诊断集中的诊断条目的最长公共子序列,得到多个第一初始相似度值;第二计算子模块,用于计算所述待处理的第一诊断条目与所述第一候选诊断集中的诊断条目的杰卡德相似系数,得到多个第二初始相似度值;第一优化子模块,用于对所述多个第一初始相似度值和所述多个第二初始相似度值进行准确度优化,得到多个优化后的第一初始相似度值和多个优化后的第二初始相似度值;第二处理子单元,用于分别依据每个优化后的第一初始相似度值和每个优化后的第二初始相似度值,得到所述多个第一目标相似度值。
21.进一步地,所述优化子模块包括:构建子模块,用于依据诊断条目中的目标词语,
构建与所述目标词语对应的词语集,其中,所述目标词语为以下至少之一:预设词语、时间节点词语、部位/器官/组织词语、正反词语、同位词语、诊断别名和数字词语;第二优化子模块,用于依据所述目标词语对应的词语集对所述多个第一初始相似度值和所述多个第二初始相似度值进行准确度优化,得到所述多个优化后的第一初始相似度值和所述多个优化后的第二初始相似度值。
22.进一步地,所述计算单元包括:第一确定子单元,用于从所述多个第一目标相似度值中选取最大的相似度值,将所述最大的相似度值对应的所述第一候选诊断集中的诊断条目作为目标诊断条目;判断子单元,用于判断所述目标诊断条目和所述待处理的第一诊断条目是否满足判断准则中的任意一条准则;第二确定子单元,用于若所述目标诊断条目和所述待处理的第一诊断条目满足判断准则中的任意一条准则,则表示所述目标诊断条目与所述待处理的第一诊断条目之间有边连接;第三确定子单元,用于若所述目标诊断条目和所述待处理的第一诊断条目不满足判断准则中的任意一条准则,则表示所述待处理的第一诊断条目未匹配成功,所述待处理的第一诊断条目与所述第二诊断条目没有边连接;第四确定子单元,用于确定所述待处理的第二诊断条目与所述第二候选诊断集中的诊断条目之间的有边连接和所述待处理的第二诊断条目与所述第一诊断条目之间的没有边连接;构建子单元,用于依据有边连接和没有边连接,得到所述每个第一诊断集与所述第二诊断集之间的多个二部图。
23.进一步地,所述判断准则至少包括以下准则:准则一:优化后的第一初始相似度值大于等于第一预设值;准则二:优化后的第二初始相似度值大于等于第二预设值;准则三:在所述目标诊断条目是所述待处理的第一诊断条目的子字符串的情况下,所述优化后的第一初始相似度值大于等于第三预设值,或者,在所述待处理的第一诊断条目是所述目标诊断条目是子字符串的情况下,所述优化后的第一初始相似度值大于等于所述第三预设值;准则四:在所述目标诊断条目是所述待处理的第一诊断条目的子序列的情况下,所述优化后的第一初始相似度值大于等于所述第三预设值,或者,在所述待处理的第一诊断条目是所述目标诊断条目是子序列的情况下,所述优化后的第一初始相似度值大于等于所述第三预设值;准则五:在所述目标诊断条目是所述待处理的第一诊断条目的子字符串的情况下,所述优化后的第二初始相似度值大于等于第四预设值,或者,在所述待处理的第一诊断条目是所述目标诊断条目是子字符串的情况下,所述优化后的第二初始相似度值大于等于所述第四预设值;准则六:在所述目标诊断条目是所述待处理的第一诊断条目的子序列的情况下,所述优化后的第二初始相似度值大于等于所述第四预设值,或者,在所述待处理的第一诊断条目是所述目标诊断条目是子序列的情况下,所述优化后的第二初始相似度值大于等于所述第四预设值。
24.进一步地,所述扩充单元包括:第一扩充子单元,用于依据未匹配的第一诊断条目对所述基础诊断条目库进行扩充;第二扩充子单元,用于若存在一一匹配的第一诊断条目和第二诊断条目,则将所述第一诊断条目作为与所述第一诊断条目一对一匹配的第二诊断条目的别名,并扩充到所述基础诊断条目库中;第三扩充子单元,用于若存在非一一匹配的第一诊断条目和第二诊断条目,则选择值最高相似度值对应的第一诊断条目对所述基础诊断条目库进行扩充;第五确定子单元,用于将扩充后的基础诊断条目库作为所述目标诊断条目库。
25.进一步地,所述装置还包括:分词单元,用于若所述匹配结果指示未匹配成功,则对所述待处理的医疗诊断数据进行分词,得到第三索引字符;建立单元,用于建立所述目标诊断条目库的索引库;筛选单元,用于依据所述第三索引字符和所述索引库,对所述目标诊断条目库中的目标诊断条目进行筛选,得到第三候选诊断集;第二计算单元,用于计算所述待处理的医疗诊断数据与所述第三候选诊断集的第三目标相似度值,并基于所述第三目标相似度值,从所述第三候选诊断集中的目标诊断条目确定所述待处理的医疗诊断数据对应的标准诊断数据。
26.根据本发明实施例的另一方面,还提供了一种电子设备,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述的数据的处理方法。
27.在本发明实施例中,采用以下步骤:获取待处理的医疗诊断数据,其中,待处理的医疗诊断数据中至少包括以下之一:待处理的诊断名称和待处理的诊断名称对应的诊断代码;将待处理的诊断名称和/或待处理的诊断名称对应的诊断代码,与目标诊断条目库进行等值匹配,得到匹配结果,其中,目标诊断条目库中包括目标诊断条目,目标诊断条目中包括标准诊断代码和标准诊断代码对应的标准诊断名称,目标诊断条目库是通过对不同医疗机构的诊断标准目录进行等值匹配以及对不同医疗机构的诊断标准目录构建二部图得到的标准库;若匹配结果指示匹配成功,则从目标诊断条目库中的目标诊断条目确定待处理的医疗诊断数据对应的标准诊断数据,解决了相关技术中对于不同的医疗诊断数据通过人工的方式进行匹配汇总,导致匹配效率比较低的技术问题。通过将待处理的医疗诊断数据与目标诊断条目库进行等值匹配,得到待处理的医疗诊断数据对应的标准诊断数据,达到了提高匹配效率的效果。将待处理的医疗诊断数据转换为标准诊断数据,能够快速地对诊断数据进行汇总和集中管理,是数据治理的一个有效手段,不仅提高了数据质量,也提高了数据展示、数据分析、数据挖掘的准确性。
附图说明
28.此处所说明的附图用来提供对本发明的进一步理解,构成本技术的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
29.图1是根据本发明实施例一提供的计算机终端的示意图;
30.图2是根据本发明实施例一提供的数据的处理方法的流程图;
31.图3是根据本发明实施例一提供的二部图的示意图;
32.图4是根据本发明实施例一提供的可选的数据的处理方法的流程图;
33.图5是根据本发明实施例二提供的数据的处理方法的流程图;
34.图6是根据本发明实施例三提供的数据的处理装置的示意图;
35.图7是根据本发明实施例四提供的电子设备的示意图。
具体实施方式
36.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人
员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
37.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
38.首先,在对本技术实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
39.icd10:icd-10即国际疾病和有关健康问题的国际统计分类(第10次修订本),英文全称为“the international statistical classification of diseases and related health problems 10th revision”缩写icd-10,是世界卫生组织(who)依据疾病的某些特征,按照规则将疾病分门别类,并用编码的方法来表示的系统。
40.icd9-cm-3:是who为手术操作制定的标准分类码,即国际疾病分类手术操作码。
41.lcs相似度:lcs相似度是基于最长公共子序列(longest common subsequence,lcs)的,lcs是两个字符串之间包含的最长公共字符子序列。比如字符串“abcdef”与字符串“acdfg”的最长公共子序列为“acdf”,长度为4,而两个字符串的长度分别是6和5,那么lcs相似度为4*2/(5+6)=8/11。
42.jaccard相似度:两个字符串的jaccard相似度为:两个名称的共有的字符(交集)个数比上两个名称的字符集的并集的个数。比如字符串“abbcd”与字符串“abef”的字符的交集为{a,b},个数为2,并集为{a,b,c,d,e,f},个数为6,那么jaccard相似度为2/6。
43.子字符串:如“abc”是“abcd”的子字符串,而“abd”不是“abcd”的子字符串,也就是说子字符串需要是连续的。
44.子序列:如“abc”是“abcd”的子序列,而“abd”也是“abcd”的子序列,也就是说子序列不需要是连续,只要保持顺序。
45.unigram集:一个字符串的unigram集为该字符串的所有单个字符,如“aabbc”的unigram集为{'a','b','c'}。
46.实施例1
47.根据本发明实施例,还提供了一种数据的处理方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
48.本技术实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现数据的处理方法的计算机终端(或移动设备)的硬件结构框图。如图1所示,计算机终端10(或移动设备10)可以包括处理器集合102(处理器集合102可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置、以及处理器集合102可以包括处理器集合,图1中采用102a,102b,
……
,102n来示出)、用于存储数据的存
储器104、以及用于通信功能的传输模块106。除此以外,还可以包括:显示器、输入/输出接口(i/o接口)、通用串行总线(usb)端口(可以作为bus总线的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
49.应当注意到的是上述处理器集合102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本技术实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
50.存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的数据的处理方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的数据的处理方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
51.传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(network interface controller,nic),其可通过与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(radio frequency,rf)模块,其用于通过无线方式与互联网进行通讯。
52.显示器可以例如触摸屏式的液晶显示器(lcd),该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。
53.在上述运行环境下,本技术提供了如图2所示的数据的处理方法。图2是根据本发明实施例一的数据的处理方法的流程图。
54.步骤s201,获取待处理的医疗诊断数据,其中,待处理的医疗诊断数据中至少包括以下之一:待处理的诊断名称和待处理的诊断名称对应的诊断代码。
55.步骤s202,将待处理的诊断名称或待处理的诊断名称对应的诊断代码,与目标诊断条目库进行等值匹配,得到匹配结果,其中,目标诊断条目库中包括目标诊断条目,目标诊断条目中包括标准诊断代码和标准诊断代码对应的标准诊断名称。
56.步骤s203,若匹配结果指示匹配成功,则从目标诊断条目库中的目标诊断条目确定待处理的医疗诊断数据对应的标准诊断数据。
57.具体地,对不同地区不同等级不同医院的医疗数据进行集中存储与管理,对于后续相关医疗研究是至关重要的,但是不同地区不同等级不同医院的诊断可能采用不同的诊断条目,甚至同一医院不同科室也采用不同的诊断条目,这样大大增加了诊断数据汇总的难题。因此,为了更好的汇总诊断数据,便于后续医疗研究,在本发明实施例一中建立了一个统一的齐全的目标诊断条目库,然后根据目标诊断条目库对实际的诊断数据(即上述的待处理的医疗诊断数据)进行归一化处理,得到待处理的医疗诊断数据对应的标准诊断数
据,这样在后续能够快速地对诊断数据进行集中存储与管理。
58.首先,获取待处理的医疗诊断数据,一般来说待处理的医疗诊断数据由诊断名称和诊断名称对应的诊断代码组成,例如,原发性高血压:a100。目标诊断条目库是通过不同医疗机构的诊断标准目录进行等值匹配,以及根据不同医疗机构的诊断标准目录构建二部图得到的标准库。二部图是通过计算不同医疗机构的诊断标准目录的相似度构建的。
59.根据待处理的诊断名称和/或待处理的诊断名称对应的诊断代码与目标诊断条目库进行等值匹配,若能匹配得到,则通过目标诊断条目库中的目标诊断条目得到待处理的医疗诊断数据的标准诊断数据。例如,待处理的医疗诊断数据为原发性高血压:a100,对应的标准诊断数据为i100:原发性高血压。
60.综上所述,通过将待处理的医疗诊断数据与目标诊断条目库进行等值匹配,得到待处理的医疗诊断数据对应的标准诊断数据,提高了诊断数据的匹配效率。将待处理的医疗诊断数据转换为标准诊断数据,能够快速地对诊断数据进行汇总和集中管理,不仅提高了数据质量,也提高了数据展示、数据分析、数据挖掘的准确性。
61.如何构建目标诊断条目库是至关重要的,所以在本发明实施例一提供的数据的处理方法中,目标诊断条目库通过以下步骤建立:获取预设的存储区域的诊断标准目录(即从不同医疗机构获取多个诊断标准目录),并对诊断标准目录进行处理,得到多个初始诊断条目库,依据多个初始诊断条目库中的诊断条目的数量,从多个初始诊断条目库中进行选择,得到基础诊断条目库;将多个初始诊断条目库中除基础诊断条目库之外的其他初始诊断条目库,作为多个第一诊断条目库。
62.依据诊断代码或诊断代码对应的诊断名称,将每个第一诊断条目库中的每个诊断条目与基础诊断条目库中的每个诊断条目进行等值匹配,得到多个第一诊断集和第二诊断集,其中,每个第一诊断集由每个第一诊断条目库中未与基础诊断条目库中的诊断条目匹配上的多个第一诊断条目组成,第二诊断集由基础诊断条目库中未与第一诊断条目库中的诊断条目匹配上的多个第二诊断条目组成;分别对每个第一诊断集与第二诊断集进行相似度计算,得到多个目标相似度值,并依据多个目标相似度值,构建每个第一诊断集与第二诊断集之间的多个二部图;依据多个二部图对基础诊断条目库进行扩充,得到目标诊断条目库。
63.具体地,由于数据中心的数据来自于多个医院(即上述的医疗机构),这些医院可能存在多个诊断条目,因此,第一步需要对这些医院所采用的诊断条目进行匹配,并且需要将这些标准进行处理形成一个统一的覆盖率全的标准集,具体步骤如下:
64.获取不同医疗机构的诊断标准目录,然后处理每一个诊断标准目录,对来源于不同的医院的每一个诊断标准目录进行格式处理,得到两列数据:诊断代码(code)与诊断代码对应的诊断名称(name),进而得到k个初始诊断条目库libi={lib1,lib2,...,libk},i∈{1,2,..,k}。
65.从上述的k个初始诊断条目库中到诊断标准最多的诊断条目库作为基础诊断条目库lib
base
,然后将剩余的k-1个初始诊断条目库作为第一诊断条目库。将第一诊断条目库与基础诊断条目库lib
base
进行诊断代码或者诊断代码对应的诊断名称的等值匹配,诊断代码或者诊断代码对应的诊断名称相同则匹配上。对于匹配上的无需再处理。
66.通过上述的等值匹配过程得到,多个第一诊断集和第二诊断集,第一诊断集由每
个第一诊断条目库中未与基础诊断条目库中的诊断条目匹配上的多个第一诊断条目组成,第二诊断集由基础诊断条目库中未与第一诊断条目库中的诊断条目匹配上的多个第二诊断条目组成。假设第一诊断集为第二诊断集为
67.对于未匹配上的第一诊断集为和第二诊断集为进行相似匹配,因为这两个集合中,虽然代码/名称不等值,但是可能存在同一诊断但是代码或者名称不同的情况。因此需要相似匹配,基于名称进行相似度匹配。
68.在一可选的实施例中,可以选用以下四种相似度函数结合计算相似度值:
69.lcs相似度:
70.jaccard相似度:
71.子字符串:is_substr={name1是name2的子字符串}or{name2是name1的子字符串};
72.子序列:is_subseq={name1是name2的子字符串}or{name2是name1的子字符串},其中,name1和name2表示待进行相似度进行的两个名称,lcs为两个字符串之间包含的最长公共字符子序列,len为长度。
73.通过计算未匹配上的第一诊断集和第二诊断集的相似度,得到多个目标相似度值。再利用多个目标相似度值构建多个二部图,通过二部图对基础标准诊断库进行扩充,得到目标诊断条目库。
74.综上所述,通过上述步骤得到的目标诊断条目库基本准确涵盖了现有的诊断条目,进而通过目标诊断条目库能够准确得到实际诊断数据对应的标准诊断数据。
75.为了提高相似度的计算效率,在分别对每个第一诊断集与第二诊断集进行相似度计算时作了以下限定:对每个第一诊断集中的第一诊断条目进行分词,并基于分词后的第一诊断条目建立第一索引表;建立第二诊断集中的第二诊断条目对应的第二索引表;依据第一索引表得到待处理的第一诊断条目的第一索引字符,并依据第二索引表得到待处理的第二诊断条目的第二索引字符;依据第一索引字符和第二索引字符,分别对每个第一诊断集与第二诊断集进行相似度计算,得到多个目标相似度值。
76.需要说明的是,对诊断条目进行分词时,可以采用一元分词,二元分词以及三元分词等,可以根据实际需求对诊断条目进行分词。
77.例如,对第一诊断集中的诊断条目进行一元分词(unigram),基于一元分词后的第一诊断条目建立第一索引表,例如,中有三个诊断:[“脑卒中”,“高血压”,“高血压1级”],那么对应的第一索引表包括:{“脑”:[“脑卒中”],“卒”:[“脑卒中”],“中”:[“脑卒中”],“高”:[“高血压病”,“高血压一级”],“血”:[“高血压病”,“高血压一级”],“压”:[“高血压病”,“高血压一级”]}。
[0078]
对第二诊断集为中的诊断条目进行一元分词(unigram),然后基于一元分词后的第二诊断条目建立第二索引表,例如,中包括有三个诊断:[“脑梗塞”、“高血压病”、“高血压i级”],那么对应的第二索引表包括:{“脑”:[“脑梗塞”],“梗”:[“脑梗塞”],“塞”:[“脑梗塞”],“高”:[“高血压病”,“高血压i级”],“血”:[“高血压病”,“高血压i级”],“压”:[“高血压病”,“高血压i级”]}。
[0079]
例如,采用二元分词,“高血压”对应得到的索引表为{“高血”,“血压”}。
[0080]
在计算相似度值时,根据第一索引表得到待处理的第一诊断条目的第一索引字符,根据第二索引表得到待处理的第二诊断条目的第二索引字符。通过第一索引字符和第二索引字符,计算第一诊断集和第二诊断集的相似度得到多个目标相似度值。
[0081]
通过索引字符进行相似度值,能够有效提高计算效率。
[0082]
为了提高相似度的计算效率,采用以下步骤进行相似度计算,得到多个目标相似度值:依据第一索引字符和第二索引表对第二诊断集中的第二诊断条目进行筛选,得到第一候选诊断集,并计算待处理的第一诊断条目与第一候选诊断集中的诊断条目的相似度,得到多个第一目标相似度值;依据第二索引字符和第一索引表对第一诊断集中的第一诊断条目进行筛选,得到第二候选诊断集,并计算待处理的第二诊断条目与第二候选诊断集中的诊断条目的相似度,得到多个第二目标相似度值;将多个第一目标相似度值和多个第二目标相似度值作为多个目标相似度值。
[0083]
具体地,根据第一索引字符和第二索引表对第二诊断集中的第二诊断条目进行筛选,得到第一候选诊断集,然后计算待处理的第一诊断条目与第一候选诊断集中的诊断条目的相似度,得到多个第一目标相似度值;根据第二索引字符和第一索引表对第一诊断集中的第一诊断条目进行筛选,得到第二候选诊断集,然后计算待处理的第二诊断条目与第二候选诊断集中的诊断条目的相似度,得到多个第二目标相似度值。例如,中的“脑卒中”这一诊断条目对应的第一索引字符为{“脑”,“卒”,“中”},因此只需要从得到这些索引字符对应的诊断条目作为第一候选诊断集中的诊断条目即可。
[0084]
通过上述步骤,不需要将中的每一个诊断与中的每一个诊断都进行相似度计算,大大提高了计算效率。
[0085]
为了提高相似度匹配的准确性,分别计算待处理的第一诊断条目与第一候选诊断集中的诊断条目的lcs相似度和jaccard相似度:计算待处理的第一诊断条目与第一候选诊断集中的诊断条目的最长公共子序列,得到多个第一初始相似度值;计算待处理的第一诊断条目与第一候选诊断集中的诊断条目的杰卡德相似系数,得到多个第二初始相似度值;对多个第一初始相似度值和多个第二初始相似度值进行准确度优化,得到多个优化后的第一初始相似度值和多个优化后的第二初始相似度值;分别依据每个优化后的第一初始相似度值和每个优化后的第二初始相似度值,得到多个第一目标相似度值。
[0086]
具体地,可以采用以下公式计算lcs相似度(即上述的第一初始相似度值)和jaccard相似度(即上述的第二初始相似度值):
[0087]
lcs相似度:
[0088]
jaccard相似度:
[0089]
在得到第一初始相似度值和第二初始相似度值之后,为了提高相似度的准确性,还需要对第一初始相似度值和第二初始相似度值进行准确度优化,将优化后的第一初始相似度值和优化后的第二初始相似度值作为第一目标相似度值。
[0090]
需要说明的是,第二目标相似度值的获取方法与第一目标相似度值是一致的,在
此不再赘述。
[0091]
主要通过以下方法对多个第一初始相似度值和多个第二初始相似度值进行准确度优化:依据诊断条目中的目标词语,构建与目标词语对应的词语集,其中,目标词语为以下至少之一:预设词语、部位/器官/组织词语、正反词语、同位词语、诊断别名和数字词语;依据目标词语对应的词语集对多个第一初始相似度值和多个第二初始相似度值进行准确度优化,得到多个优化后的第一初始相似度值和多个优化后的第二初始相似度值。
[0092]
具体地,构建与目标词语对应的词语集,目标词语包括:预设词语、部位/器官/组织词语、正反词语(性质)、同位词语、诊断别名和数字词语等。需要说明的是,并不只限定于上述的几种词语进行词语集的扩充。
[0093]
a.无意义的词(即上述的预设词语)。去掉诊断名称中没有区分度的字词,从而提升相似度值的准确性。如很多诊断条目后面会加一个“病”或者“证”字,“高血压病”与“高血压”、“药毒伤胃证”与“药毒伤胃”等,因此需要将没有区分度的词去掉,从而可以提高相似度计算的准确度与效率。
[0094]
b.部位/器官/组织词语。有些不同的诊断条目虽然名称非常相似,但是部位不同,比如“肾恶习肿瘤”与“肺恶心肿瘤”,因此需要修正,识别诊断条目中的部位,如果部位不同,则不相似,因此维护一个部位/器官/组织词语集。
[0095]
c.正反词语(性质)。有些不同的诊断条目虽然名称非常相似,但是存在意义相反的词,比如“慢性胃炎”与“急性胃炎”、“心阴虚证”与“心阳虚证”、“胃良性肿瘤”与“胃恶性肿瘤”、“妊娠合并1型糖尿病(非胰岛素)”与“妊娠合并1型糖尿病(胰岛素)”等,因此维护一个正反字词语集。
[0096]
d.同位词语。对于有些诊断,存在字符不同的同位词,如“恶性肿瘤”与“癌”、“颅”与“脑”等,如“胃恶性肿瘤”与“胃癌”、“颅内出血”与“脑内出血”等,在对诊断名称进行匹配时,如果诊断名称中存在这些同位词,则进行扩增后再匹配。比如在中叫做“肺癌”,而中叫做“肺恶性肿瘤”,那么,的“肺癌”扩增为{“肺癌”,“肺恶性肿瘤”},的“肺恶性肿瘤”扩增为{“肺恶性肿瘤”,“肺癌”},再进行相似度计算。因此维护一个同位词词语集。
[0097]
e.同义诊断。对于一些诊断,存在相似度低的同义诊断。比如“脑卒中”与“脑梗死”,lcs相似度只有1/3,jaccard相似度只有1/5,两种相似度均较低,但是“脑卒中”与“脑梗死”为同一诊断,因此需要维护一个诊断别名词语集。
[0098]
f.统一数字表达。对于很多诊断条目中,存在同一数字不同表达,有中文数字、阿拉伯数字、罗马数字等,['十二','十一','十','九','八','七','六','五','四','三','二','一']、['12','11','10','9','8','7','6','5','4','3','2','1']、['

','

','

','

','

','ⅶ','ⅵ','

','ⅳ','ⅲ','ⅱ','ⅰ']、['xii','xi','x','ix','viii','vii','vi','v','iv','iii','ii','i']一一对应。如“1型糖尿病”与
“ⅰ
型糖尿病”等。因此统一数字表达。
[0099]
通过上述步骤,进行相似度优化,进一步提高了相似度的准确度。
[0100]
对于如何构建二部图是至关重要的,所以在本发明实施例中采用以下步骤得到二部图:从多个第一目标相似度值中选取最大的相似度值,将最大的相似度值对应的第一候选诊断集中的诊断条目作为目标诊断条目;判断目标诊断条目和待处理的第一诊断条目是
否满足判断准则中的任意一条准则;若目标诊断条目和待处理的第一诊断条目满足判断准则中的任意一条准则,则表示目标诊断条目与待处理的第一诊断条目之间有边连接;若目标诊断条目和待处理的第一诊断条目不满足判断准则中的任意一条准则,则表示待处理的第一诊断条目未匹配成功,待处理的第一诊断条目与第二诊断条目没有边连接;确定待处理的第二诊断条目与第二候选诊断集中的诊断条目之间的有边连接和待处理的第二诊断条目与第一诊断条目之间的没有边连接;依据有边连接和没有边连接,得到每个第一诊断集与第二诊断集之间的多个二部图。
[0101]
判断准则至少包括以下准则:准则一:优化后的第一初始相似度值大于等于第一预设值;准则二:优化后的第二初始相似度值大于等于第二预设值;准则三:在目标诊断条目是待处理的第一诊断条目的子字符串的情况下,优化后的第一初始相似度值大于等于第三预设值,或者,在待处理的第一诊断条目是目标诊断条目是子字符串的情况下,优化后的第一初始相似度值大于等于第三预设值;准则四:在目标诊断条目是待处理的第一诊断条目的子序列的情况下,优化后的第一初始相似度值大于等于第三预设值,或者,在待处理的第一诊断条目是目标诊断条目是子序列的情况下,优化后的第一初始相似度值大于等于第三预设值;准则五:在目标诊断条目是待处理的第一诊断条目的子字符串的情况下,优化后的第二初始相似度值大于等于第四预设值,或者,在待处理的第一诊断条目是目标诊断条目是子字符串的情况下,优化后的第二初始相似度值大于等于第四预设值;准则六:在目标诊断条目是待处理的第一诊断条目的子序列的情况下,优化后的第二初始相似度值大于等于第四预设值,或者,在待处理的第一诊断条目是目标诊断条目是子序列的情况下,优化后的第二初始相似度值大于等于第四预设值。
[0102]
具体地,有些诊断条目并不是同一诊断条目,但是相似度值不为0。因此,需要采用一定的判断策略进行判断,在本发明实施例中,提出以下判断准则(只要满足条件之一):
[0103]
a.lcs相似度不少于0.65(对应的上述的准则一);
[0104]
b.jaccard相似度不少于0.65(对应的上述的准则二);
[0105]
c.(lcs相似度或者jaccard相似度不少于0.55)且(is_substr或者is_subseq)(对应的上述的准则三、准则四、准则五和准则六)。
[0106]
对于中的每一个诊断条目从第一候选诊断集中到最大相似度值对应的诊断条目(判断优先选择lcs相似度,lcs相似度相等时,再根据jaccard相似度进行选择),如果最大相似度值对应的诊断条目不满足判断准则,说明该诊断条目在中不到匹配,该诊断条目与中的第二诊断条目没有边连接。如果满足判断准则,该诊断条目与最大相似度值对应的诊断条目(即上述的目标诊断条目)右边连接。采用相同方法确定中的每一个诊断条目的有边连接和没有边连接。这样就构造了二部图,二部图左边的节点来自于中的标准,右边的节点来自于中的诊断条目,这样可以得到k-1个二部图。例如,如图3所示二部图的示意图。
[0107]
通过二部图能够准确描述每个诊断条目的对应关系,有助于快速对基础诊断条目库进行扩充,得到目标诊断条目库。
[0108]
依据多个二部图对基础诊断条目库进行扩充,得到目标诊断条目库包括:依据未匹配的第一诊断条目对基础诊断条目库进行扩充;若存在一一匹配的第一诊断条目和第二
诊断条目,则将第一诊断条目作为与第一诊断条目一对一匹配的第二诊断条目的别名,并扩充到基础诊断条目库中;若存在非一一匹配的第一诊断条目和第二诊断条目,则选择值最高相似度值对应的第一诊断条目对基础诊断条目库进行扩充;将扩充后的基础诊断条目库作为目标诊断条目库。
[0109]
具体地,采用以下方式对基础诊断条目库进行扩充,例如,可以结合图3进行相应的理解:
[0110]
a.在不到匹配(即一对零)的第一诊断条目直接进行添加基础诊断条目库,如图3中的(1)所示。
[0111]
b.对第二诊断条目的零对一,如图3中的(2)所示,不需要处理。
[0112]
c.对于一对一,如图3中的(3)所示;或者多对一,如图3中的(5)所示,将第一诊断条目作为与第一诊断条目一对一匹配的第二诊断条目的别名,并扩充到基础诊断条目库中。
[0113]
d.对于一对多和多对多,如图3中的(4)和(6)所示,将最高相似度对应的第一诊断条目作为对应的第二诊断的别名扩充到基础诊断条目库中。
[0114]
通过上述步骤,实现了对基础诊断条目库的扩充,丰富了目标诊断条目库的内容,进而提高了后续匹配的准确性。
[0115]
在待处理的医疗诊断数据与目标诊断条目库未能匹配成功时,采用以下方式得到对应的标准诊断数据:对待处理的医疗诊断数据进行分词,得到第三索引字符;建立目标诊断条目库的索引库;依据第三索引字符和索引库,对目标诊断条目库中的目标诊断条目进行筛选,得到第三候选诊断集;计算待处理的医疗诊断数据与第三候选诊断集的第三目标相似度值,并基于第三目标相似度值,从第三候选诊断集中的目标诊断条目确定待处理的医疗诊断数据对应的标准诊断数据。
[0116]
具体地,对目标诊断条目库进行中文unigram索引库建立(对应上述的索引库)。然后,对待处理的医疗诊断数据进行分词,得到第三索引字符,则基于第三索引字符和索引库从目标诊断条目库中筛选得到候选匹配标准诊断集,只需要从这个候选集中相似度最高的诊断条目作为其归一化输出(即标准诊断数据),相似度计算也采用上述的四种相似度算法结合的方式进行计算,并且使用上述的优化方法进行相似度优化。这样在实际诊断数据中,每个诊断数据都能从目标诊断条目库中得到一个标准诊断数据。例如,如图4所示的待处理的医疗诊断数据与目标诊断条目库进行匹配和相似度匹配示意图,如图4中的左肺上叶恶性肿瘤这一待处理的医疗诊断数据,在去除方位词后的最终匹配结果为肺恶性肿瘤。
[0117]
在从目标诊断条目库中的目标诊断条目确定待处理的医疗诊断数据对应的标准诊断数据之后,该方法还包括:对标准诊断数据进行汇总,得到汇总后的标准诊断数据;通过预设数据分析工具对汇总后的标准诊断数据进行分析,得到分析报告。
[0118]
对得到的标准诊断数据进行汇总和存储,然后通过预设数据分析工具(例如,excel、sas等)对汇总后的标准诊断数据进行分析,得到分析报告,如,分析相关病例的分布情况以及发展趋势等,通过分析报告,可以对疾病分布以及疾病发展趋势等进行评测和预估。
[0119]
如图5所示,可以根据图5的流程图实现对医疗诊断数据的处理。对现有的标准诊断目录进行处理,得到第一诊断条目库和基础诊断条目库;对第一诊断条目库和基础诊断
进行等值匹配和相似度计算;基于相似度值构建二部图,并利用二部图得到目标诊断条目库,最后通过目标诊断条目库进行数据归一化。本发明实施例可以达到如下技术效果:1)不仅对不同的标准库之间进行精细化匹配,并且构建了统一的标准库(目标诊断条目库)。2)对非等值匹配的诊断条目,基于多种相似度结合的方法,进行匹配扩充。3)针对诊断名称的特性,进行了相似度优化,来满足不同的特定匹配场景。4)使用了中文字符unigram建立索引,加快匹配的效率。5)采用了多种优化方案,准确度非常高,不需要过多的人工干预,实现自动化与智能化,进而大大提升了诊断数据的匹配效率。
[0120]
综上所述,在本发明实施例一提供的数据的处理方法中,通过获取待处理的医疗诊断数据,其中,待处理的医疗诊断数据中至少包括以下之一:待处理的诊断名称和待处理的诊断名称对应的诊断代码;将待处理的诊断名称或待处理的诊断名称对应的诊断代码,与目标诊断条目库进行等值匹配,得到匹配结果,其中,目标诊断条目库中包括目标诊断条目,目标诊断条目中包括标准诊断代码和标准诊断代码对应的标准诊断名称,目标诊断条目库是通过对不同医疗机构的诊断标准目录进行等值匹配以及对不同医疗机构的诊断标准目录构建二部图得到的标准库;若匹配结果指示匹配成功,则从目标诊断条目库中的目标诊断条目确定待处理的医疗诊断数据对应的标准诊断数据,解决了相关技术中对于不同的医疗诊断数据通过人工的方式进行匹配汇总,导致匹配效率比较低的技术问题。通过将待处理的医疗诊断数据与目标诊断条目库进行等值匹配,得到待处理的医疗诊断数据对应的标准诊断数据,将待处理的医疗诊断数据转换为标准诊断数据能够快速的对诊断数据进行汇总和集中管理,是数据治理的一个有效手段,不仅提高了数据质量,也提高了数据展示、数据分析、数据挖掘的准确性,进而达到了提高匹配效率的效果。
[0121]
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
[0122]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
[0123]
实施例2
[0124]
根据本发明实施例,还提供了一种数据的处理方法,如图6所示,图6是根据本发明实施例二的数据的处理方法的流程图。
[0125]
步骤s601,获取客户端发送待处理的医疗诊断数据,其中,待处理的医疗诊断数据中至少包括以下之一:待处理的诊断名称和待处理的诊断名称对应的诊断代码。
[0126]
步骤s602,在云端服务器中将待处理的诊断名称或待处理的诊断名称对应的诊断代码,与目标诊断条目库进行等值匹配,得到匹配结果,其中,目标诊断条目库中包括目标诊断条目,目标诊断条目中包括标准诊断代码和标准诊断代码对应的标准诊断名称,目标
诊断条目库是通过对不同医疗机构的诊断标准目录进行等值匹配以及对不同医疗机构的诊断标准目录构建二部图得到的标准库,若匹配结果指示匹配成功,则从目标诊断条目库中的目标诊断条目确定待处理的医疗诊断数据对应的标准诊断数据。
[0127]
步骤s603,将待处理的医疗诊断数据对应的标准诊断数据返回至客户端。
[0128]
具体地,通过客户端将待处理的医疗诊断数据发送至云端服务器中,在云端服务器中将待处理的诊断名称或待处理的诊断名称对应的诊断代码,与目标诊断条目库进行等值匹配,得到匹配结果。若匹配结果指示匹配成功,则从目标诊断条目库中的目标诊断条目确定待处理的医疗诊断数据对应的标准诊断数据。
[0129]
通过云端服务器处理医疗诊断数据的归一化,提升了医疗诊断数据匹配的效率,并且减少了本地终端的存储压力。
[0130]
在云端服务器中,对医疗诊断数据的处理的具体方法与实施例一中的方法相同,在此不再赘述。
[0131]
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
[0132]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
[0133]
实施例3
[0134]
根据本发明实施例,还提供了一种用于实施上述数据的处理方法的数据的处理装置,如图7所示,该装置包括:第一获取单元701,第一匹配单元702和第一确定单元703。
[0135]
第一获取单元701,用于获取待处理的医疗诊断数据,其中,待处理的医疗诊断数据中至少包括以下之一:待处理的诊断名称和待处理的诊断名称对应的诊断代码。
[0136]
第一匹配单元702,用于将待处理的诊断名称或待处理的诊断名称对应的诊断代码,与目标诊断条目库进行等值匹配,得到匹配结果,其中,目标诊断条目库中包括目标诊断条目,目标诊断条目中包括标准诊断代码和标准诊断代码对应的标准诊断名称。
[0137]
第一确定单元703,用于若匹配结果指示匹配成功,则从目标诊断条目库中的目标诊断条目确定待处理的医疗诊断数据对应的标准诊断数据。
[0138]
在本发明实施例三提供的数据的处理装置中,通过第一获取单元701获取待处理的医疗诊断数据,其中,待处理的医疗诊断数据中至少包括以下之一:待处理的诊断名称和待处理的诊断名称对应的诊断代码;第一匹配单元702将待处理的诊断名称或待处理的诊断名称对应的诊断代码,与目标诊断条目库进行等值匹配,得到匹配结果,其中,目标诊断条目库中包括目标诊断条目,目标诊断条目中包括标准诊断代码和标准诊断代码对应的标准诊断名称,目标诊断条目库是通过对不同医疗机构的诊断标准目录进行等值匹配以及对
不同医疗机构的诊断标准目录构建二部图得到的标准库;第一确定单元703若匹配结果指示匹配成功,则从目标诊断条目库中的目标诊断条目确定待处理的医疗诊断数据对应的标准诊断数据,解决了相关技术中对于不同的医疗诊断数据通过人工的方式进行匹配汇总,导致匹配效率比较低的技术问题。通过将待处理的医疗诊断数据与目标诊断条目库进行等值匹配,得到待处理的医疗诊断数据对应的标准诊断数据,将待处理的医疗诊断数据转换为标准诊断数据能够快速的对诊断数据进行汇总和集中管理,是数据治理的一个有效手段,不仅提高了数据质量,也提高了数据展示、数据分析、数据挖掘的准确性,进而达到了提高匹配效率的效果。
[0139]
可选地,在本发明实施例三提供的数据的处理装置中,目标诊断条目库通过以下步骤建立:第二确定单元,用于从不同医疗机构的诊断标准目录中确定多个第一诊断条目库和基础诊断条目库,其中,第一诊断条目库中包括多个诊断条目,诊断条目由诊断代码和诊断代码对应的诊断名称组成;第二匹配单元,用于依据诊断代码或诊断代码对应的诊断名称,将每个第一诊断条目库中的每个诊断条目与基础诊断条目库中的每个诊断条目进行等值匹配,得到多个第一诊断集和第二诊断集,其中,每个第一诊断集由每个第一诊断条目库中未与基础诊断条目库中的诊断条目匹配上的多个第一诊断条目组成,第二诊断集由基础诊断条目库中未与第一诊断条目库中的诊断条目匹配上的多个第二诊断条目组成;第一计算单元,用于分别对每个第一诊断集与第二诊断集进行相似度计算,得到多个目标相似度值,并依据多个目标相似度值,构建每个第一诊断集与第二诊断集之间的多个二部图;扩充单元,用于依据多个二部图对基础诊断条目库进行扩充,得到目标诊断条目库。
[0140]
可选地,在本发明实施例三提供的数据的处理装置中,第一计算单元包括:分词子单元,用于对每个第一诊断集中的第一诊断条目进行分词,并基于分词后的第一诊断条目建立第一索引表;建立子单元,用于建立第二诊断集中的第二诊断条目对应的第二索引表;第一处理子单元,用于依据第一索引表得到待处理的第一诊断条目的第一索引字符,并依据第二索引表得到待处理的第二诊断条目的第二索引字符;计算子单元,用于依据第一索引字符和第二索引字符,分别对每个第一诊断集与第二诊断集进行相似度计算,得到多个目标相似度值。
[0141]
可选地,在本发明实施例三提供的数据的处理装置中,计算子单元包括:第一筛选模块,用于依据第一索引字符和第二索引表对第二诊断集中的第二诊断条目进行筛选,得到第一候选诊断集,并计算待处理的第一诊断条目与第一候选诊断集中的诊断条目的相似度,得到多个第一目标相似度值;第二筛选模块,用于依据第二索引字符和第一索引表对第一诊断集中的第一诊断条目进行筛选,得到第二候选诊断集,并计算待处理的第二诊断条目与第二候选诊断集中的诊断条目的相似度,得到多个第二目标相似度值;确定模块,用于将多个第一目标相似度值和多个第二目标相似度值作为多个目标相似度值。
[0142]
可选地,在本发明实施例三提供的数据的处理装置中,第一筛选模块包括:第一计算子模块,用于计算待处理的第一诊断条目与第一候选诊断集中的诊断条目的最长公共子序列,得到多个第一初始相似度值;第二计算子模块,用于计算待处理的第一诊断条目与第一候选诊断集中的诊断条目的杰卡德相似系数,得到多个第二初始相似度值;第一优化子模块,用于对多个第一初始相似度值和多个第二初始相似度值进行准确度优化,得到多个优化后的第一初始相似度值和多个优化后的第二初始相似度值;第二处理子单元,用于分
别依据每个优化后的第一初始相似度值和每个优化后的第二初始相似度值,得到多个第一目标相似度值。
[0143]
可选地,在本发明实施例三提供的数据的处理装置中,优化子模块包括:构建子模块,用于依据诊断条目中的目标词语,构建与目标词语对应的词语集;第二优化子模块,用于依据目标词语对应的词语集对多个第一初始相似度值和多个第二初始相似度值进行准确度优化,得到多个优化后的第一初始相似度值和多个优化后的第二初始相似度值。
[0144]
可选地,在本发明实施例三提供的数据的处理装置中,计算单元包括:第一确定子单元,用于从多个第一目标相似度值中选取最大的相似度值,将最大的相似度值对应的第一候选诊断集中的诊断条目作为目标诊断条目;判断子单元,用于判断目标诊断条目和待处理的第一诊断条目是否满足判断准则中的任意一条准则;第二确定子单元,用于若目标诊断条目和待处理的第一诊断条目满足判断准则中的任意一条准则,则表示目标诊断条目与待处理的第一诊断条目之间有边连接;第三确定子单元,用于若目标诊断条目和待处理的第一诊断条目不满足判断准则中的任意一条准则,则表示待处理的第一诊断条目未匹配成功,待处理的第一诊断条目与第二诊断条目没有边连接;第四确定子单元,用于确定待处理的第二诊断条目与第二候选诊断集中的诊断条目之间的有边连接和待处理的第二诊断条目与第一诊断条目之间的没有边连接;构建子单元,用于依据有边连接和没有边连接,得到每个第一诊断集与第二诊断集之间的多个二部图。
[0145]
可选地,在本发明实施例三提供的数据的处理装置中,判断准则至少包括以下准则:准则一:优化后的第一初始相似度值大于等于第一预设值;准则二:优化后的第二初始相似度值大于等于第二预设值;准则三:在目标诊断条目是待处理的第一诊断条目的子字符串的情况下,优化后的第一初始相似度值大于等于第三预设值,或者,在待处理的第一诊断条目是目标诊断条目是子字符串的情况下,优化后的第一初始相似度值大于等于第三预设值;准则四:在目标诊断条目是待处理的第一诊断条目的子序列的情况下,优化后的第一初始相似度值大于等于第三预设值,或者,在待处理的第一诊断条目是目标诊断条目是子序列的情况下,优化后的第一初始相似度值大于等于第三预设值;准则五:在目标诊断条目是待处理的第一诊断条目的子字符串的情况下,优化后的第二初始相似度值大于等于第四预设值,或者,在待处理的第一诊断条目是目标诊断条目是子字符串的情况下,优化后的第二初始相似度值大于等于第四预设值;准则六:在目标诊断条目是待处理的第一诊断条目的子序列的情况下,优化后的第二初始相似度值大于等于第四预设值,或者,在待处理的第一诊断条目是目标诊断条目是子序列的情况下,优化后的第二初始相似度值大于等于第四预设值。
[0146]
可选地,在本发明实施例三提供的数据的处理装置中,扩充单元包括:第一扩充子单元,用于依据未匹配的第一诊断条目对基础诊断条目库进行扩充;第二扩充子单元,用于若存在一一匹配的第一诊断条目和第二诊断条目,则将第一诊断条目作为与第一诊断条目一对一匹配的第二诊断条目的别名,并扩充到基础诊断条目库中;第三扩充子单元,用于若存在非一一匹配的第一诊断条目和第二诊断条目,则选择值最高相似度值对应的第一诊断条目对基础诊断条目库进行扩充;第五确定子单元,用于将扩充后的基础诊断条目库作为目标诊断条目库。
[0147]
可选地,在本发明实施例三提供的数据的处理装置中,装置还包括:分词单元,用
于若匹配结果指示未匹配成功,则对待处理的医疗诊断数据进行分词,得到第三索引字符;建立单元,用于建立目标诊断条目库的索引库;筛选单元,用于依据第三索引字符和索引库,对目标诊断条目库中的目标诊断条目进行筛选,得到第三候选诊断集;第二计算单元,用于计算待处理的医疗诊断数据与第三候选诊断集的第三目标相似度值,并基于第三目标相似度值,从第三候选诊断集中的目标诊断条目确定待处理的医疗诊断数据对应的标准诊断数据。
[0148]
此处需要说明的是,上述的第一获取单元701,第一匹配单元702和第一确定单元703对应于实施例1中的步骤s201至步骤s203,单元与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述单元作为装置的一部分可以运行在实施例一提供的计算机终端10中。
[0149]
本发明的实施例还提供一种电子设备,设备包括处理器、存储器即存在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:获取待处理的医疗诊断数据,其中,待处理的医疗诊断数据中至少包括以下之一:待处理的诊断名称和待处理的诊断名称对应的诊断代码;将待处理的诊断名称或待处理的诊断名称对应的诊断代码,与目标诊断条目库进行等值匹配,得到匹配结果,其中,目标诊断条目库中包括目标诊断条目,目标诊断条目中包括标准诊断代码和标准诊断代码对应的标准诊断名称;若匹配结果指示匹配成功,则从目标诊断条目库中的目标诊断条目确定待处理的医疗诊断数据对应的标准诊断数据,标准诊断数据包括标准诊断代码和/或标准诊断名称。
[0150]
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0151]
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0152]
在本技术所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
[0153]
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0154]
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0155]
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-only memory)、随机存取存储器
(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0156]
以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

技术特征:


1.一种数据的处理方法,其特征在于,包括:获取待处理的医疗诊断数据,其中,所述待处理的医疗诊断数据中至少包括以下之一:待处理的诊断名称和待处理的诊断名称对应的诊断代码;将所述待处理的诊断名称或待处理的诊断名称对应的诊断代码,与目标诊断条目库进行等值匹配,得到匹配结果,其中,所述目标诊断条目库中包括目标诊断条目,所述目标诊断条目中包括标准诊断代码和所述标准诊断代码对应的标准诊断名称;若所述匹配结果指示匹配成功,则从所述目标诊断条目库中的目标诊断条目确定所述待处理的医疗诊断数据对应的标准诊断数据,所述标准诊断数据包括标准诊断代码和/或标准诊断名称。2.根据权利要求1所述的方法,其特征在于,所述目标诊断条目库通过以下步骤建立:从预设的存储区域中确定多个第一诊断条目库和基础诊断条目库,其中,所述第一诊断条目库中包括多个诊断条目,所述诊断条目由诊断代码和所述诊断代码对应的诊断名称组成;依据所述诊断代码或所述诊断代码对应的诊断名称,将每个第一诊断条目库中的每个诊断条目与所述基础诊断条目库中的每个诊断条目进行等值匹配,得到多个第一诊断集和第二诊断集,其中,每个第一诊断集由所述每个第一诊断条目库中未与所述基础诊断条目库中的诊断条目匹配上的多个第一诊断条目组成,所述第二诊断集由所述基础诊断条目库中未与所述第一诊断条目库中的诊断条目匹配上的多个第二诊断条目组成;分别对每个第一诊断集中的诊断数据与所述第二诊断集中的诊断数据进行相似度计算,得到多个目标相似度值,并依据所述多个目标相似度值,构建所述每个第一诊断集与所述第二诊断集之间的多个二部图;依据所述多个二部图对所述基础诊断条目库进行扩充,得到目标诊断条目库。3.根据权利要求2所述的方法,其特征在于,分别对每个第一诊断集中的诊断数据与所述第二诊断集中的诊断数据进行相似度计算,得到多个目标相似度值包括:对所述每个第一诊断集中的第一诊断条目进行分词,并基于分词后的第一诊断条目建立第一索引表;建立所述第二诊断集中的第二诊断条目对应的第二索引表;依据所述第一索引表得到待处理的第一诊断条目的第一索引字符,并依据所述第二索引表得到待处理的第二诊断条目的第二索引字符;依据所述第一索引字符和所述第二索引字符,分别对每个第一诊断集中的诊断数据与所述第二诊断集中的诊断数据进行相似度计算,得到所述多个目标相似度值。4.根据权利要求3所述的方法,其特征在于,依据所述第一索引字符和所述第二索引字符,分别对每个第一诊断集中的诊断数据与所述第二诊断集中的诊断数据进行相似度计算,得到所述多个目标相似度值包括:依据所述第一索引字符和所述第二索引表对所述第二诊断集中的第二诊断条目进行筛选,得到第一候选诊断集,并计算所述待处理的第一诊断条目与所述第一候选诊断集中的诊断条目的相似度,得到多个第一目标相似度值;依据所述第二索引字符和所述第一索引表对所述第一诊断集中的第一诊断条目进行筛选,得到第二候选诊断集,并计算所述待处理的第二诊断条目与所述第二候选诊断集中
的诊断条目的相似度,得到多个第二目标相似度值;将所述多个第一目标相似度值和所述多个第二目标相似度值作为所述多个目标相似度值。5.根据权利要求4所述的方法,其特征在于,计算所述待处理的第一诊断条目与所述第一候选诊断集中的诊断条目的相似度,得到多个第一目标相似度值包括:计算所述待处理的第一诊断条目与所述第一候选诊断集中的诊断条目的最长公共子序列,得到多个第一初始相似度值;计算所述待处理的第一诊断条目与所述第一候选诊断集中的诊断条目的杰卡德相似系数,得到多个第二初始相似度值;对所述多个第一初始相似度值和所述多个第二初始相似度值进行准确度优化,得到多个优化后的第一初始相似度值和多个优化后的第二初始相似度值;分别依据每个优化后的第一初始相似度值和每个优化后的第二初始相似度值,得到所述多个第一目标相似度值。6.根据权利要求5所述的方法,其特征在于,对所述多个第一初始相似度值和所述多个第二初始相似度值进行准确度优化,得到多个优化后的第一初始相似度值和多个优化后的第二初始相似度值包括:依据诊断条目中的目标词语,构建与所述目标词语对应的词语集;依据所述目标词语对应的词语集对所述多个第一初始相似度值和所述多个第二初始相似度值进行准确度优化,得到所述多个优化后的第一初始相似度值和所述多个优化后的第二初始相似度值。7.根据权利要求6所述的方法,其特征在于,依据所述多个目标相似度值,构建所述每个第一诊断集与所述第二诊断集之间的多个二部图包括:从所述多个第一目标相似度值中选取最大的相似度值,将所述最大的相似度值对应的所述第一候选诊断集中的诊断条目作为目标诊断条目;判断所述目标诊断条目和所述待处理的第一诊断条目是否满足判断准则中的任意一条准则;若所述目标诊断条目和所述待处理的第一诊断条目满足判断准则中的任意一条准则,则表示所述目标诊断条目与所述待处理的第一诊断条目之间有边连接;若所述目标诊断条目和所述待处理的第一诊断条目不满足判断准则中的任意一条准则,则表示所述待处理的第一诊断条目未匹配成功,所述待处理的第一诊断条目与所述第二诊断条目没有边连接;确定所述待处理的第二诊断条目与所述第二候选诊断集中的诊断条目之间的有边连接和所述待处理的第二诊断条目与所述第一诊断条目之间的没有边连接;依据有边连接和没有边连接,得到所述每个第一诊断集与所述第二诊断集之间的多个二部图。8.根据权利要求7所述的方法,其特征在于,所述判断准则至少包括以下准则:准则一:优化后的第一初始相似度值大于等于第一预设值;准则二:优化后的第二初始相似度值大于等于第二预设值;准则三:在所述目标诊断条目是所述待处理的第一诊断条目的子字符串的情况下,所
述优化后的第一初始相似度值大于等于第三预设值,或者,在所述待处理的第一诊断条目是所述目标诊断条目是子字符串的情况下,所述优化后的第一初始相似度值大于等于所述第三预设值;准则四:在所述目标诊断条目是所述待处理的第一诊断条目的子序列的情况下,所述优化后的第一初始相似度值大于等于所述第三预设值,或者,在所述待处理的第一诊断条目是所述目标诊断条目是子序列的情况下,所述优化后的第一初始相似度值大于等于所述第三预设值;准则五:在所述目标诊断条目是所述待处理的第一诊断条目的子字符串的情况下,所述优化后的第二初始相似度值大于等于第四预设值,或者,在所述待处理的第一诊断条目是所述目标诊断条目是子字符串的情况下,所述优化后的第二初始相似度值大于等于所述第四预设值;准则六:在所述目标诊断条目是所述待处理的第一诊断条目的子序列的情况下,所述优化后的第二初始相似度值大于等于所述第四预设值,或者,在所述待处理的第一诊断条目是所述目标诊断条目是子序列的情况下,所述优化后的第二初始相似度值大于等于所述第四预设值。9.根据权利要求7所述的方法,其特征在于,依据所述多个二部图对所述基础诊断条目库进行扩充,得到目标诊断条目库包括:依据未匹配的第一诊断条目对所述基础诊断条目库进行扩充;若存在一一匹配的第一诊断条目和第二诊断条目,则将所述第一诊断条目作为与所述第一诊断条目一对一匹配的第二诊断条目的别名,并扩充到所述基础诊断条目库中;若存在非一一匹配的第一诊断条目和第二诊断条目,则选择值最高相似度值对应的第一诊断条目对所述基础诊断条目库进行扩充;将扩充后的基础诊断条目库作为所述目标诊断条目库。10.根据权利要求1所述的方法,其特征在于,所述方法还包括:若所述匹配结果指示未匹配成功,则对所述待处理的医疗诊断数据进行分词,得到第三索引字符;建立所述目标诊断条目库的索引库;依据所述第三索引字符和所述索引库,对所述目标诊断条目库中的目标诊断条目进行筛选,得到第三候选诊断集;计算所述待处理的医疗诊断数据与所述第三候选诊断集的第三目标相似度值,并基于所述第三目标相似度值,从所述第三候选诊断集中的目标诊断条目确定所述待处理的医疗诊断数据对应的标准诊断数据。11.一种数据的处理方法,其特征在于,包括:获取客户端发送待处理的医疗诊断数据,其中,所述待处理的医疗诊断数据中至少包括以下之一:待处理的诊断名称和待处理的诊断名称对应的诊断代码;在云端服务器中将所述待处理的诊断名称或待处理的诊断名称对应的诊断代码,与目标诊断条目库进行等值匹配,得到匹配结果,其中,所述目标诊断条目库中包括目标诊断条目,所述目标诊断条目中包括标准诊断代码和所述标准诊断代码对应的标准诊断名称,若所述匹配结果指示匹配成功,则从所述目标诊断条目库中的目标诊断条目确定所述待处理
的医疗诊断数据对应的标准诊断数据;将所述待处理的医疗诊断数据对应的标准诊断数据返回至所述客户端。12.一种数据的处理装置,其特征在于,包括:第一获取单元,用于获取待处理的医疗诊断数据,其中,所述待处理的医疗诊断数据中至少包括以下之一:待处理的诊断名称和待处理的诊断名称对应的诊断代码;第一匹配单元,用于将所述待处理的诊断名称或待处理的诊断名称对应的诊断代码,与目标诊断条目库进行等值匹配,得到匹配结果,其中,所述目标诊断条目库中包括目标诊断条目,所述目标诊断条目中包括标准诊断代码和所述标准诊断代码对应的标准诊断名称;第一确定单元,用于若所述匹配结果指示匹配成功,则从所述目标诊断条目库中的目标诊断条目确定所述待处理的医疗诊断数据对应的标准诊断数据。13.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至11中任意一项所述的数据的处理方法。

技术总结


本发明公开了一种数据的处理方法和装置、电子设备。其中,该方法包括:获取待处理的医疗诊断数据;将待处理的诊断名称或待处理的诊断名称对应的诊断代码,与目标诊断条目库进行等值匹配,得到匹配结果;若匹配结果指示匹配成功,则从目标诊断条目库中的目标诊断条目确定待处理的医疗诊断数据对应的标准诊断数据。本发明解决了相关技术中对于不同的医疗诊断数据通过人工的方式进行匹配汇总,导致匹配效率比较低的技术问题。比较低的技术问题。比较低的技术问题。


技术研发人员:

贺勇 张顺 曾震宇 李兆融 张惠顺 王菲菲

受保护的技术使用者:

阿里云计算有限公司

技术研发日:

2022.08.02

技术公布日:

2022/11/25

本文发布于:2022-11-29 16:20:42,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/4/13425.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:条目   所述   多个   目标
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图